Matxin (itzultzaile automatikoa)

Matxin euskararekin lan egiten zuen eta publikoki erabilgarri egon zen lehenengo itzulpen automatikoko (IA) sistema izan zen, Espainiako Gobernuak 2006an diruz lagunduta Euskal Herriko Unibertsitateko Ixa Taldearen eta Elhuyarren artean garatua. Software librea da, GNU GPL lizentziapean argitaratutakoa. Tresna erabilgarria izan zen eta hainbat aplikaziotan integratu zen 2019ra arte, Orduan sortu ziren [Itzultzai automatiko neuronalekhttps://eu.wikipedia.org/wiki/Itzulpen automatiko neuronal#Euskararako itzultzaile neuronalak itzultzaile automatiko neuronalek] askoz kalitate hobea lortu zuten, elia.eus itzultzailea esate baterako.

Matxin (itzultzaile automatikoa)
Jatorria
Sortzailea(k)Ixa taldea eta Elhuyar Fundazioa
Sorrera-urtea2007
Ezaugarriak
Hizkuntzaeuskara eta gaztelania
matxin.elhuyar.eus

OpenTradek barne hartzen dituen bi proiektuetako bat zen, eta ezberdintasun lexiko eta sintaktiko handiak aurkezten dituzten hizkuntzen arteko itzulpenak burutzeko prestatuta zegoen.

Matxin erabilera orokorreko itzulpen automatikoko sistema da, transferentzian oinarritua. Hiru fasetan egiten du itzulpena: analisia, transferentzia eta sorkuntza. Analisi-fasean abiapuntu-testuaren analisi sintaktikoa lortzen du (gaztelaniarako Freeling software libreko paketea erabiltzen da). Transferentzia lexikalean estaldura handiko hainbat hiztegi berrerabiliz eraikitako lexikoi elebiduna kontsultatzen da. Transferentzia estrukturalean, besteak beste, postposizioen desanbiguazioa eta aditz-kateen transferentzia burutzen da. Sorkuntza sintaktikoan hitzak eta sintagmak ordenatzen dira eta sorkuntza morfologikoan postposizioen informazioa sintagmako azken hitzari gehitzen zaio, hitzaren forma lortuz Morfeus euskararako prozesadore morfologikoarekin. Hainbat tresna eta baliabide linguistiko berrerabili direnez, bereziki landu da sistemako datuen, erregelen eta moduluen arteko datu-fluxuaren formatuen estandarizazioa.

Sistemaren arkitektura abiapuntu-hizkuntzatik independentea izateko diseinatuta zegoen eta inplementatuta dagoen Matxin 1.0 prototipoak espainieratik euskarara itzultzen du. Matxin 2.0 prototipoak aurreko lanaren hobekuntzak ditu eta, horrez gain, SMT sistema berria garatu da euskaratik espainierara itzultzeko.

Prototipoak OpenTrad proiektuko webgunean proba daitezke.[1] Sourceforge-n kode irekiko software libre gisa banatzen da.[2]

Ikus, gainera aldatu

Erreferentziak aldatu

  • Mayor A. (2007) "Matxin: Erregeletan oinarritutako itzulpen automatikoko sistema baten eraikuntza estaldura handiko baliabide linguistikoak berrerabiliz". Doktoradutza-tesia. Euskal Herriko Unibertsitateko Donostiako Informatika Fakultatea.
  • Alegria I., Díaz de Ilarraza A., Labaka G., Lersundi M., Mayor A., Sarasola K. (2007) "Transfer-based MT from Spanish into Basque: reusability, standardization and open source". LNCS 4394. 374-384. Cicling 2007.
  • Alegria I., Díaz de Ilarraza A., Labaka G., Lersundi M., Mayor A., Sarasola K., M. Forcada, S. Ortiz, L. Padró (2005) "An Open Architecture for Transfer-based Machine Translation between Spanish and Basque". In Proceedings of the MT Summit X Workshop on Open-Source Machine Translation Workshop.

Kanpo estekak aldatu