Xuxen

XUXEN euskaraz idatzitako testuak zuzentzen dituen aplikazio informatikoa

Xuxen euskaraz idatzitako testuak zuzentzen dituen aplikazio informatikoa da. UPV/EHUko Ixa Taldeak 1994an sortutako aplikazio hau Eusko Jaurlaritzako Hizkuntza Politikarako Sailburuordetzak finantzatu zuen. Gipuzkoako Foru Aldundiak, berriz XUXENen webgunea garatzeko diru-laguntza eskaini zuen.

 Xuxen
Jatorria
Sorrera-urtea1994
Azken bertsioa5.1
Ezaugarriak
Hizkuntzaeuskara
EuskarriaFoma eta Hunspell
Irakur dezakePlataforma-anitz, Microsoft Windows eta Mac OS
Euskaraz
EuskarazBai
xuxen.eus
Xuxeneko lehen edizioa (1994)

2020an bosgarren bertsioan zebilen, Elhuyarrek merkaturatuta Ixa taldearen lizentziarekin.[1] Hainbat testu-editore eta bestelako programetan (MS Office, LibreOffice, Mozillako Firefox eta Thunderbird...),[2] sarean zuzenean erabiltzeko aukera ere badago.[3][4][5]

Historia aldatu

Xuxen I (1994, 65.000 morfema) aldatu

Lehen edizioa, 1994ko irailean plazaratu zuten Ixa taldeak, UZEIk eta Hizkia enpresak, bi diskete eta eskuliburua zituen kutxa batean.[6][7] Hasieran, aplikazioa erabili ahal izateko deskargatu eta instalatu egin behar zen programa. Bi sistema eragiletarako (Microsoft Windows eta Mac OS) eta bi testu-editoretarako (MS Word eta WordPerfect) balio zuen; baina offline moduan lan egin behar zen: aurrena dokumentua prestatu, eta gero egiaztatu eta zuzendu.

Hizkia enpresa Klaudio Harluxetek 1990an sortua zen Baionako SEI taldearen babesean, Hizkuntzaren Prozesamenduaren arloan lan egiteko. Xuxen-erako Hizkia enpresak egin zuen lan informatikoa Alexandre DaCosta-k egin zuen.[8]

Xuxen-en programa barruan ez zegoen sartuta hitz edo atzizkiei buruzko informazioa, hori aparte zegoen datu-base batean. Euskararen Datu-Base Lexikala (EDBL) euskarazko hitz eta morfemei buruzko informazio morfologiko zabala biltzen zuen datu-basea zen, hiztegi informatiko baten moduko zerbait da, baina hitz-erroak (lemak) gain, atzizkiak-eta hartzen ditu eta bakoitzaren propietate lexiko eta morfologikoak zehazten ditu definizio bakoitzak; horrekin programak jakingo du, adibidez, etxe lema -ra atzizkiarekin lotu daitekeela etxera hitza sortuz ("etxe + ra --> etxera") edo "genuen + la --> genuela" ere posible dela, baina "etxe + la --> etxela" edo "genuen + ra --> genuera" ez direla posible. 1994an Xuxenen lehen bertsioa argitaratu zenean 65.000 sarrera zeuden datu basean, lemak edota atzizkiak. informazio horrekin euskarazko milioika hitz-forma desberdin ezagutzeko gauza zen Xuxen, adibidez: etxera, etxeetatik, , etxerainokoa, genuelako, genuenarekin... [10][11][6]

1994an Xuxenen lehen ber,tsioa argitaratu zenean 65.000 sarrera zeuden EDBLn, non sarrera bakoitza morfema bat zen; etxe bezalako lema bat edo -raino bezako atzizki bat. Baina geroago osatuz joan zen UZEIren EEBS corpusa (Egungo Euskararen Bilketa Sistematikoa) hedatzen joan zen heinean, eta geroago Euskaltzaindiak hiztegi batua hedatzen joan den heinean.[12] Aberaste-prozesu horren ondorioz 2018an 125.074 sarrera zeuden EDBL datu-basean.[13]

Xuxen II (1999, 73.000 morfema) aldatu

1999an plazaratu zen bigarren bertsioak (Xuxen II) aukera berriak ekarri zituen: Euskaltzaindiak 1999ko maiatzean onartutako lexiko eta arau berriak integratu zituen (1999an 73.000 hitz zeuden EDBL datu-base lexikoalean); Ibon Sarasolaren Euskal Hiztegian eta Elhuyar Hiztegiko hitz berriak ere bai, eta Euskaldunon Egunkariak eta UZEIk sortutako corpusak ere baliatu zituzten horretan. Bestalde euskalkietako zenbait hitz ezagutu eta beren ordezko estandarra proposatzen zuen., esaterako handi, eta ez haundi.[14]

Xuxen III (2001, Word eta Powerpointekin integratuta) aldatu

 
Xuxen III, Egunkarian (2001-05-15)

2001ean CD-ROM batean Euskaldunon Egunkariaren bidez banatu zen hirugarren bertsioa baliagarria izan zen Word, Acces, Powerpoint, Front Page eta Outlook programekin; Mac eta PC-rako bertsioak zituen (Pc-Office 97, Office 2000 eta Mac-Office 98); eta Euskaltzaindiaren erabakien arabera eguneratuta zegoen.[15]

Xuxen IV (2006, software libre) aldatu

 
Ixa xuxen. Anjel Lertxundi (2013)[16]

2006eko Xuxen IV bertsioa kualitatiboki oso berria izan zen: software librea zen eta software libreko hainbat programarekin erabili ahal zen, lehenengo aldiz. 2004an sortu zen hunspell programak flexio handiko hizkuntzei ate berri bat zabaldu zien software librearen munduan, eta OpenOffice proiektuan ere onartua izan zen bere 2.0.2 bertsiotik aurrera. Hungarierarako garatu zen hasieran hunspell, baina myspell-ek proposatutako eredua aberasten zuenez beste edozein hizkuntzetarako ere erabil zitekeen. Paradigma kopuru handia onartzen zuen, baita bi atzizki kateatzea ere (bi baino ez, ordea). Baldintza horiekin euskarak zituen lehengo eragozpenak saihets ahal izan ziren, neurri onargarri batean gutxienez.[17]

2011n Foma programa informatikoak laguntza tekniko erabakigarria ekarri zion Xuxeni, software libre gisa bertsio azkar eta eraginkorra sortu ahal izateko. Mans Huldenek eta Iñaki Alegria ikertzaileak lankidetzan aritu ziren horretarako. Horri esker, behingoz, Firefox eta Thunderbird programek euskara ere zuzendu ahal izan zuten.[17]

xuxen.eus (2014, sarean erabilgarri) aldatu

2014an xuxen.eus aurkeztu zen Durangoko azokan, euskarazko testuen zuzenketa sarearen bidez egiteko aukera, eta gainera estra batzuekin: Euskaltzaindiaren hitzen forma hobetsiak proposatzen hasi zen; Interneten zuten presentziaren arabera ordenatzen zituen hitz oker bat zuzentzeko proposamenak; Elhuyar hiztegietan bilatzeko aukera hitz baten gainean klik bikoitza egitean; eta testua entzuteko aukera ere eskaintzen zuen.[18][19][20]

Xuxen 5 (2015, 125.074 morfema) aldatu

2015ean plazaratu zen Xuxen 5 bertsioa, ordura arte Euskaltzaindiak eta Elhuyar Hiztegiak onartutako azken hitz berriekin.[21][22][23][24]

2018an plazaratu zen Xuxen 5.1 bertsioak, bere azken eguneraketekin gutxienez 125.074 hitz-forma desberdin ezagutzeko aukera zuen, 1999an 73.000 bano ez ziren.[25] 1994an lehen bertsioa sortu zenetik EDBL datu-basean eguneratzen da informazio hori.

2020an bosgarren bertsioan zebilen, Elhuyarrek merkaturatuta Ixa taldearen lizentziarekin[1], eta aplikazio integragarria da hainbat testu-editore eta bestelako programetan (MS Office, LibreOffice, Mozillako Firefox eta Thunderbird...),[2] sarean zuzenean erabiltzeko aukera ere eskaintzen da (Xuxen-en webgunearen bitartez).[3][4][5]

Ikerketa-lana aldatu

Iñaki Alegria informatikariaren tesiak eta Miriam Urkia hizkuntzalariarenak Xuxen zuzentzaile ortografikoaren oinarri informatikoa eta linguistikoa ezarri zuten.[26][27][28][29] Euskara mundu digitalean erabili ahal izateko lehen urratsetako bat izan zen; 1995ean Luistxo Fernandezek idatzitako Leihoak Zabalduz txostenean azaltzen zen bezala; urte berean plazaratu zen euskaraz zebilen lehen sistema eragilea ere (Windows 95).

Geroago, Morfologia konputazionala: euskararen morfologiaren deskribapena liburua argitaratu zuten bien artean 2002an.[30]

Iñaki Alegriak 1995an defenditu zuen doktore-tesiko muinak euskararen analisi morfologiko automatikoa (Morfeus) eta Xuxen zuzentzaile ortografikoa izan ziren.[31][32] 1999an plazaratu zen bigarren bertsioa, berriro Hizkia enpresarekin. Bere datu-baseak 73.000 hitz izatera heldu zen, %10 gehiago.[14]

Hasierako bi bertsioetan Egoera finituko teknologiakren garapen propio bat erabili zen eta hirugarrenean Xuxenen arauak eta lexikoiak Xerox enpresako XFST programarekin kudeatzen ziren. Beste hizkuntza askotan ez, baina euskarazko morfologia hain aberatsa denez, beharrezkoa zen puntako teknologia testu zuzenketa bizkor egin ahal izateko. Baina XFST ez zen software librea. 2011an Mans Hulden eta Iñaki Alegria ikertzaileek euskararen morfologia landu zuten foma software azkar berriarekin. 2010ean Mans Hulden-ek sortutako foma tresnaren laguntzarekin zuzentzaile ortografikoaren software libreko bertsio azkar bat sortu ahal izan zuten. Xuxen zuzentzailea Foma-rekin birdefinituta, Open Office, Mozilla Thunderbird edo Mozilla Firefox bezalako banaketa libreko programetan ere bere osotasunean integratu ahal izan zen. Behingoz, euskara ere zuzendu ahal izango zuten.[17] Hortik zetorren Foma-ren garrantzia.

Erreferentziak aldatu

  1. a b Goikoetxea, Garikoitz. «Zuzenketez gain, euskara baturako era hobetsiak ere baditu Xuxenek» Berria (Noiz kontsultatua: 2020-04-24).
  2. a b «Xuxen.eus - Xuxen - Bertsio nagusiak deskargatu» xuxen.eus (Noiz kontsultatua: 2020-04-24).
  3. a b EITB-EUS. «Xuxen bateragarria da jada Word 2016rekin» www.eitb.eus (Noiz kontsultatua: 2020-04-24).
  4. a b NAIZ. (2018-05-22). «Xuxen euskarazko zuzentzaile berritua kaleratu du Elhuyarrek» NAIZ (Noiz kontsultatua: 2020-04-24).
  5. a b «"Xuxen" zuzentzaile ortografiko berritua erabiltzeko prest» sustatu.eus (Noiz kontsultatua: 2020-04-24).
  6. a b «Xuxen euskararako lehen zuzentzaile ortografikoa kaleratu berri dute.» Euskaldunon Egunkaria (Noiz kontsultatua: 2020-04-24).
  7. a b Fernandez, Luistxo. (1995-12-24). «Leihoak Zabalduz. Windows95 euskaratua, hizkuntza makinen bidez lantzeko tresna berriak... Informatikaren eta euskararen arteko muga esploratu gabeetan barrena abiatu gara - Wikiteka» eu.wikisource.org (Euskaldunon Egunkaria) (Noiz kontsultatua: 2020-04-25).
  8. Aduriz (eta beste 12), Itziar. (1994-09-01). XUXEN-Mac Corrector ortográfico para textos en euskera. .
  9. Xuxen, Kimmo Koskeniemmi eta FSMLNP2012 – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2023-04-12).
  10. «EDBL | Ixa taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2020-05-13).
  11. «EDBL - Euskararen Datu-Base Lexikala Interneten» ixa2.si.ehu.es (Noiz kontsultatua: 2020-05-13).
  12. «Leihoak Zabalduz. Windows95 euskaratua, hizkuntza makinen bidez lantzeko tresna berriak... Informatikaren eta euskararen arteko muga esploratu gabeetan barrena abiatu gara - Wikiteka» eu.wikisource.org (Noiz kontsultatua: 2020-05-13).
  13. Zenbat hitz desberdin ezagutzen ditu Xuxen 5.1-ek? – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-05-13).
  14. a b c Petxarroman, Iñaki. (1999-07-16). «Euskarazko zuzentzailea ortografikoaren bigarren bertsioa aurkeztu dute. Xuxen II EHUko informatikako ikertaldeak egin du, UZEI eta Hizkia enpresekin lankidetzan.» Euskaldunon Egunkariaren hemeroteka. 1990-2003. (berria.eus) (Noiz kontsultatua: 2021-02-03).
  15. Berria.eus. «Xuxen euskarazko zuzentzaile automatikoa.» Euskaldunon Egunkariaren hemeroteka. 1990-2003. (berria.eus) (Noiz kontsultatua: 2021-12-29).
  16. HITZ BESTE: Ez adiorik, Xuxen-zale amorratu hori – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2023-08-29).
  17. a b c Ixa. (2006-12-05). eu-spell: Xuxen software libre gisa eskainia eta software librean integratua – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2022-01-07).
  18. Erabili Xuxen sarean estra batzuekin (xuxen.eus) – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2022-01-07).
  19. Elhuyar aldizkariko elkarrizketa bat Iñaki Alegria Ixakidearekin – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2022-01-07).
  20. Galarraga Aiestaran, Ana. (2014-05-01). «"UEUren bidez lortutako sarea niretzat oso garrantzitsua izan da, maila pertsonalean zein akademikoan"» Zientzia.eus (Noiz kontsultatua: 2022-01-07).
  21. «Xuxen 5, hobetuz doan lanabesa» EITB Euskal Irrati Telebista (Noiz kontsultatua: 2022-01-07).
  22. Goikoetxea, Garikoitz. «Zuzenketez gain, euskara baturako era hobetsiak ere baditu Xuxenek» Berria (Noiz kontsultatua: 2022-01-07).
  23. (Gaztelaniaz) Moyano, Izaskun. (2015). «'Xuxen 5' euskarazko zuzentzaile berria sarean da» El Correo (Noiz kontsultatua: 2022-01-07).
  24. (Gaztelaniaz) «Xuxen 5-en marra gorri, berde eta urdinak» El Diario Vasco 2015-11-10 (Noiz kontsultatua: 2022-01-07).
  25. Ixa. (2018-07-18). Zenbat hitz desberdin ezagutzen ditu Xuxen 5.1-ek? – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2022-01-07).
  26. Alegria Loinaz, Iñaki. (1995). Euskal morfologiaren tratamendu automatikorako tresnak. UPV/EHU- (TESIKER euskarazko tesiak).[Betiko hautsitako esteka]
  27. Urkia, Miriam. (1997). Euskal morfologiaren tratamendu informatikorantz. UPV/EHU - TESIKER euskarazko tesiak.[Betiko hautsitako esteka]
  28. Alegria Loinaz, Iñaki. (1995). «EUSKAL MORFOLOGIAREN TRATAMENDU AUTOMATIKORAKO TRESNAK.» www.educacion.gob.es (TESEO tesis doctorales) (Noiz kontsultatua: 2020-04-24).
  29. Urkia, Miriam. (1997). «EUSKAL MORFOLOGIAREN TRATAMENDU INFORMATIKORANTZ» www.educacion.gob.es (UPV/EHU) (Noiz kontsultatua: 2020-04-25).
  30. Alegria Loinaz, Iñaki; Urkia Gonzalez, Miriam. (2002). Morfologia konputazionala. UEU ISBN 9788484380344. (Noiz kontsultatua: 2018-12-15).
  31. Alegria I., Euskal morfologiaren tratamendu automatikorako tresnak. Informatika Fakultatea, UPV-EHU, 1995eko uztaila
  32. (Ingelesez) Alegria, I.; Artola, X.; Sarasola, K.; Urkia, M.. (1996-12-01). «Automatic morphological analysis of Basque» Literary and Linguistic Computing 11 (4): 193–203.  doi:10.1093/llc/11.4.193. ISSN 0268-1145. (Noiz kontsultatua: 2020-04-25).

Ikus, gainera aldatu

Kanpo estekak aldatu