IXA pipes

Hizkuntzaren prozesamendurako software libre, testuak linguistikoki analizatzeko erabiltzen dena

IXA pipes testuak automatikoki lantzeko hainbat tresna informatikoz osatutako multzo bat da, hizkuntzaren prozesamenduan hainbat hizkuntzatarako erabil daitekeena.[1][2]

IXA pipes
Jatorria
Sorrera-urtea2014
Ezaugarriak
Hizkuntzagaztelania, euskara, nederlandera, frantsesa, galiziera, alemana eta italiera
Programazio-lengoaiaJava (mul) Itzuli
Egile-eskubideakcopyrightduna
LizentziaApache Lizentzia 2.0.
Euskaraz
EuskarazBai
http://ixa2.si.ehu.es/ixa-pipes/
Testuak automatikoki analizatzeko Ixa-pipes tresnen arkitektura.

Ixa Taldeko kide den Rodrigo Agerrik sortu zuen 2014an eta software librea da (Apache lizentzia 2.0). Euskararako Ixa pipes katearekin lortzen den prozesamendu linguistikoa bestela ere egin daiteke IxaKat tresnekin ere. Izan ere, Ixa pipes hizkuntzaren prozesamendurako hainbat tresna eleaniztunen sorta bat da, eta baditu hainbat tresna euskararen prozesamendurako. IxaKat eta IXA pipes kateak modularrak direnez, eta biek NAF formatua erabiltzen dutenez sarrera/irteera formatu moduan, bi multzotako tresnak konbinatu daitezke prozesamendu-kate berean.

Ixa-pipes multzoko tresna nagusiak hauek dira:

  • ixa-pipe-tok: Tokenizatzailea eta segmentatzailea hainbat hizkuntzatarako. Testu bateko hitzak, puntuazio-markak, zenbakiak eta antzeko osagaiak banatzen dituena
  • ixa-pipe-pos: Testu bateko hitz bakoitzaren lema eta kategoria lortzea (adjektibo, izen, aditz...). Ingelesez lemmatizer eta POS tagging esaten zaie tresna horiei. Erabil daiteke hizkuntza hauekin: euskara, herbeherera, ingelesa, frantzesa, galiziera, alemana, italiera eta espainiera.
  • ixa-pipe-nerc: Entitate izendunak errekonozitzen ditu eta testuan etiketatzen dtu. Ingelesez Named Entity Recognition tagger esaten zaie tresna horri. Erabil daiteke hizkuntza hauekin: euskara, herbeherera, ingelesa, alemana, italiera eta espainiera.
  • Iritzi-helburuen erauzketa. Ingeleserako bakarrik.
  • ixa-pipe-chunk: Zati sintaktiko bakoitza bereiztea. Erabil daiteke hizkuntza hauekin: euskara eta ingelesa. Estatistikoki detektatzen ditu sintagma mailako osagai sintaktiko sinpleak).
  • ixa-pipe-parse: Probabilistic constituent parser for Spanish and English.

Erreferentziak

aldatu
  1. (Ingelesez) Agerri, Rodrigo. «IXA pipes: Efficient and Ready to Use Multilingual NLP tools.» (PDF) Language Resources and Evaluation Conference (LREC2014), (Noiz kontsultatua: 2018-03-06).
  2. (Ingelesez) IXA pipes: ready to use NLP tools. (Noiz kontsultatua: 2018-03-06).

Kanpo estekak

aldatu