Elia.eus

Itzultzaile automatikoa (lehen itzultzailea.eus)

elia.eus web-aplikazioa itzultzaile eleanitz automatikoa da, webgune baten bidez edo mugikorreko app baten bidez erabil daiteke. Elhuyar Fundazioak 2019an plazaratu zuen bertsioak itzulpen automatiko neuronala erabiltzen du.

Elia RGB logo2021.png Elia.eus
Elia martxan es 2021 02.png
Jatorria
SortzaileaElhuyar Fundazioa eta Ixa taldea
Argitaratze-data2019
Ezaugarriak
Hizkuntzaeuskara, gaztelania, katalana, galiziera, frantsesa eta ingelesa
Euskaraz
EuskarazBai
elia.eus

2019an plazaratuta erabiltzaileen aldetik arrakasta handia lortu zuen. 2022ko hasierarako Eliak 30 miloi tik gora itzulpen-eskaera bideratuta zituen, eta eskaera horiei erantzuteko 715 miloi hitz eta 5.393 dokumentu itzuli behar izan zituen.[1][2] Ordurako 10.000 baino gehiago ziren erregistratutako erabiltzaileak.

Gainera Elia itzultzailea euskarazko Wikipedian zuzenean erabiltzen ari da Content Translation web-zerbitzuan integratuta, artikuluak hainbat hizkuntzatatik euskarara itzultzeko.[2][3]

HistoriaAldatu

Elhuyar fundazioak 2006tik eskaintzen 2019ko bertsioak itzultzailea.eus izena zuen, eta 2020ko urtean izugarrizko arrakasta lortu zuen: 1.776.767 bisita jaso eta 12.180.660 itzulpen-eskaera bideratu zituen.[1][4] 2020ko datuak hobetu zituen 2021ean: bi milioi bisitatik gora izan zituen, ia 600.000 erabiltzaile eta guztira, 610 milioi hitz baino gehiago itzuli zituen sistemak.[2]

Euskararako lehenengo itzulpen automatikoko sistema Matxin izan zen. 2009tik publikoki erabilgarri egon zen Elhuyar Fundazioaren webgunean 2019ra arte. Espainiako Gobernuak 2006an diruz lagunduta Euskal Herriko Unibertsitateko Ixa Taldearen eta Elhuyarren artean garatua. Software librea da, GNU GPL lizentziapean argitaratutakoa. Tresna erabilgarria izan zen eta hainbat aplikaziotan integratu zen 2019ra arte, Orduan sortu ziren [./Itzultzai_automatiko_neuronalekhttps://eu.wikipedia.org/wiki/Itzulpen_automatiko_neuronal#Euskararako_itzultzaile_neuronalak itzultzaile automatiko neuronalek] askoz kalitate hobea lortu zutenak, elia.eus itzultzailea esate baterako.

Erabili ahal diren hizkuntzak etaAldatu

 
Hizkuntza-bikote bakoitzean elia.eus itzultzaile neuronalak zenbat itzuli zuen 2021ean .[2]

Hizkuntza hauekin lan egiten du elia.eus-ek :

  1. Espainiera
  2. Euskara
  3. Frantsesa
  4. Galiziera
  5. Katalanera
  6. Ingelesa

2021ean gehien itzuli zuena gaztelaniatik euskarara izan zen, itzulitakoaren erdia baino gehiago bikote horretan egin zuen. Hurrengo bikote erabiliena euskara-gaztelania ere izan zen baina beste norabidean, kasu honetan egindako lan ia hiru aldiz txikiagoa izan zen. Proportzioan lan-karga handia hartu zuten beste hizkuntza-bikote batzuk ingelesa-gaztelania, gaztelania-katalana eta gaztelania-galegoa izan ziren.[2]

Wikipediako artikuluak itzultzeko tresnaAldatu

Elia itzultzailea euskarazko Wikipedian zuzenean erabiltzen ari da, Content Traslation web-aplikazioaren bitartez, artikuluak hainbat hizkuntzatatik euskarara itzultzeko.[5] adibidez. Wikipediatik guztira 1.369.988 hitz itzuli zituen 2022 baino lehenago.

Erabilera asko handitzen ari da, eta esate baterako 2022ko otsailean Wikipediarako 150.685 hitz itzuli zituen gaztelaniatik euskarara, 40.652 ingelesetik euskarara, kopuru berdintsuan (40.677 hitz) ingelesetik katalanera), 28.264 hitz frantsesetik euskarara, edo 14.187 hitz katalanetik euskarara.[3][2]

Zein hizkuntzatatik zein hizkuntzatara es-eu en-ca en-eu fr-eu ca-eu en-fr en-es eu-ca gl-eu fr-ca en-gl eu-es
Wikipediako zenbat hitz itzuli ziren Eliarekin 2022ko otsailean 150.685 40.677 40.652 28.264 14.187 9.354 857 536 351 273 192 64

Itzulpen automatiko neuronalaAldatu

Alor horretan izan den garapena ikaragarri azkarra izan da. Ikaskuntza sakona (deep learning) teknika Itzulpengintza automatikoan erabili zuen lehenengo argitalpen zientifikoa 2014ean agertu zen, egileak Bahdanau, Cho eta Bengio izan ziren. 2015ean lehenengo aldiz agertu zen neurona-sistema bat itzulpen automatikozko txapelketa batean (OpenMT’15). Eta hurrengo urtean txapeldunen %90a sistema neuronalak izan ziren. 2015eko aurrerapena arretan oinarritutako sistemak ("attenttion based NMT") erabiltzea izan zen. 2017an hobekuntza gehigarriak lortu ziren neurona-sareetan Transformer arkitektura erabiltzearen ondorioz. Urte bat geroago euskara ere arrakastaz erabiltzen zuen sistema bat zegoen, eta beste urte batean, 2019an, euskararako zeuden sistemak bost ziren.

Euskararako itzultzaile neuronalakAldatu

Paradigma neuronalaren ekarriarekin 2017z geroztik izugarrizko hobekuntza nabaritu zen hizkuntza nagusienen arteko itzultzaile automatikoetan. Geroxeago, eta arin, euskal munduko ikerkuntza komunitatea gai izan zen euskaratik eta euskararako itzultzaile neuronalak mundu mailako artearen egoeraren pare jartzeko.

2015ean hasi zen euskararako itzulpen neuronala aztertzen TADEEP proiektuan.[6] Orurako Deepl itzultzaileak kalitatezko emaitzak ematen zituen 10 hizkuntzatan baina euskara ez zegoen horien artean. Bi urte geroago lehenengo emaitza bikainak lortuta, 2017an lehen demoa publikoki eskura zegoen. 2017an bertan, hainbat agente (Ixa Taldea, Elhuyar, Vicomtech, Ametzagaña, Mondragon Lingua...) batera, MODELA izeneko proiektua abiatu zen.[7] Beste urtebeteko epean, 2018an MODELA itzultzailea plazaratu zen, Interneten publiko orokorrerako euskarazko itzulpen neuronala eskaintzen zuen lehen zerbitzua.

Abiada bizian mugitzen zen arlo honetan, geroago gutxienez beste hiru itzultzaile neuronal gehiago plazaratu ziren. Horien arteko diferentzia nagusia itzultzaile bakoitzak erabiltzen duen corpusa da (corpus = milioika esaldi bi hizkuntzatan), baita itzultzeko zerbitzuan onartzen duten hitz-kopuru maximoa ere (konputagailu ahaltsu eta garestiak erabili behar dira horretan). Hauek ziren 2020ko hasieran eskaintzen ziren euskararako itzultzaile neuronalak:

  • Eusko Jaurlaritzaren Itzuli Itzultzaile neuronala: itzulpen neuronalaren teknologia erabilita, corpus-oinarria Eusko Jaurlaritzako itzulpen-memoriak erabili ziren IVAP-HAEEk 20 urtetan bildutakoa 10 milioi "esaldi" baino gehiago..[8]
  • batua.eus: Vicomtech-ek MODELA sisteman hobekuntzak egin zituzten (RNN teknologiatik Transformer teknologiara pasa ziren) eta corpusa handitu zuten.[9][10]
  • elia.eus (hasieran Itzultzailea.eus): Elhuyarrek ere antzeko hobekuntzak egin zituen bere aldetik. Eta itzulpenak egiteko hizkuntza berriak gehitu zituen (ingelesa, frantsesa, espainiera, galegoa, eta katalana)[11]
  • Translate Google: Googleren Translate zerbitzuak hobekuntzak lortu zituen eredu neuronala erabilita.[12]

ErreferentziakAldatu

  1. a b «Elhuyarren itzultzaileak izen berria du: Elia» GAUR8 2021-03-22 (Noiz kontsultatua: 2021-03-23).
  2. a b c d e f «Elia Elhuyarren itzultzaile automatikoak % 40 egin du gora erabiltzaileetan | Elhuyar» www.elhuyar.eus (Noiz kontsultatua: 2022-03-24).
  3. a b «Elia Wikipedian integraturik, erronka proposatu dute ENE honetarako» sustatu.eus (Noiz kontsultatua: 2021-12-06).
  4. «Elhuyarren itzultzaile automatiko neuronala: urtebete testu eleaniztunak sortzen | Elhuyar» www.elhuyar.eus (Noiz kontsultatua: 2022-03-24).
  5. Elia Euskarazko Wikipedian: nola erabili – Euskal Wikilarien Kultur Elkartea. (Noiz kontsultatua: 2022-03-24).
  6. «Welcome to TAdeep (MINECO-FEDER project) | TAdeep» ixa2.si.ehu.es (Noiz kontsultatua: 2020-01-28).
  7. «MODELA» modela.ametza.com (Noiz kontsultatua: 2020-01-28).
  8. Eusko Jaurlaritza. (2019). «Euskara-Gaztelania itzultzaile automatiko neuronala» www.euskadi.eus (Noiz kontsultatua: 2020-01-28).
  9. «BATUA.eus - Euskarazko itzultzailea» www.batua.eus (Noiz kontsultatua: 2020-01-28).
  10. Vaswani, Ashish; Shazeer, Noam; Parmar, Niki; Uszkoreit, Jakob; Jones, Llion; Gomez, Aidan N; Kaiser, Łukasz; Polosukhin, Illia. (2017). Guyon, I. ed. «Attention is All you Need» Advances in Neural Information Processing Systems 30 (Curran Associates, Inc.): 5998–6008. (Noiz kontsultatua: 2020-01-28).
  11. «Itzultzailea» Itzultzailea (Noiz kontsultatua: 2020-01-28).
  12. «Google Translate» translate.google.com (Noiz kontsultatua: 2020-01-28).

Ikus, gaineraAldatu

Kanpo estekakAldatu