Antton Gurrutxaga: berrikuspenen arteko aldeak

Ezabatutako edukia Gehitutako edukia
Ksarasola (eztabaida | ekarpenak)
tNo edit summary
Etiketa: 2017 wikitestu editorearekin
Ksarasola (eztabaida | ekarpenak)
9. lerroa:
== Hiztegigile eta corpus-sortzaile ==
[[Fitxategi:Andoni_Sagarna.png|thumb|300x300px|Andoni Sagarna (2017)<ref name=":0">{{Erreferentzia|abizena=UZEI Terminologia eta Lexikografia Zentroa|izenburua=#LarretikNoranahi dokumentala|data=2017-11-27|url=https://www.youtube.com/watch?v=nuwnKDI7Ds8&feature=youtu.be&t=454|sartze-data=2017-12-11}}</ref>]]
[[Testu corpus|Testu-corpusen]] sorkuntzan aitzindaria izan zen [[Andoni Sagarna]] aitzindaria izan zen [[UZEI|UZEIn]], bere zuzendaritzapean garatu zen [[Testu corpus#XX. mendeko euskararen corpus estatistikoa|XX. mendeko euskararen corpus estatistikoa]].<ref>[http://www.jakingunea.com/50urte/html/Jakin89_54/Jakin89_54.html «Egungo euskararen bilketa-lan sistematikoa (EEBS)»]. ''Jakin'', 54. zenbakia, 213-226, 1989.</ref><ref>{{Erreferentzia|abizena=Euskaltzaindia|izenburua=XX. mendeko Euskararen Corpus estadistikoa|url=http://xxmendea.euskaltzaindia.net/Corpus/aurkezpena.html|sartze-data=2017-12-11}}</ref> Berak metodo oso zehatzak definitu zituen orduan, batetik hizkuntzaren erabileraren inbentarioa lortzeko, eta bestetik testu guzti horien "argazki ona" izan beharko zen lagin estatistikoa definitzeko. Hizkuntzaren erabilera erreala deskribatzeko balio duten, eta horrexegatikhorretxegatik hiztegiak sortzeko ezinbesteko oinarria dira [[Testu corpus|testu-corpusak]]. Ildo horretatik jarraituta '''Gurrutxagak''' hainbat corpus bildu eta etiketatzeko proiektutan parte hartu du geroago [[Elhuyar Fundazioa|Elhuyar Fundazioan]], esaterako, [[Testu corpus#Zientzia%20eta%20Teknologia%20corpusa%20(ZT)|Zientzia eta Teknologia corpusa]] sortzeko.
Ikerketa alor honetan erabiltzaile, ikertzaile eta dibulgatzailea da. [[Joseba Intxausti|Joseba Intxaustiren]] enkarguz [[UZEI|UZEIren]] hiztegiak errazago kudeatzeko [[Klaudio Harluxet|Klaudio Harluxetek]] garatu zuen aplikazio informatikoaren erabiltzaile aurreratua izan zen Andoni Sagarna. [[1987|1987an]] Udako Euskal Unibertsitatean eman zuen sarrera hitzaldian gai horri ekin zion ''Terminologi bankuak'' izeneko aurkezpen batekin.
 
[[Testu corpus|Testu-corpusen]] sorkuntzan [[Andoni Sagarna]] aitzindaria izan zen [[UZEI|UZEIn]], bere zuzendaritzapean garatu zen [[Testu corpus#XX. mendeko euskararen corpus estatistikoa|XX. mendeko euskararen corpus estatistikoa]].<ref>[http://www.jakingunea.com/50urte/html/Jakin89_54/Jakin89_54.html «Egungo euskararen bilketa-lan sistematikoa (EEBS)»]. ''Jakin'', 54. zenbakia, 213-226, 1989.</ref><ref>{{Erreferentzia|abizena=Euskaltzaindia|izenburua=XX. mendeko Euskararen Corpus estadistikoa|url=http://xxmendea.euskaltzaindia.net/Corpus/aurkezpena.html|sartze-data=2017-12-11}}</ref> Berak metodo oso zehatzak definitu zituen orduan, batetik hizkuntzaren erabileraren inbentarioa lortzeko, eta bestetik testu guzti horien "argazki ona" izan beharko zen lagin estatistikoa definitzeko. Hizkuntzaren erabilera erreala deskribatzeko balio duten, eta horrexegatik hiztegiak sortzeko ezinbesteko oinarria dira [[Testu corpus|testu-corpusak]]. Ildo horretatik jarraituta '''Gurrutxagak''' hainbat corpus bildu eta etiketatzeko proiektutan parte hartu du geroago [[Elhuyar Fundazioa|Elhuyar Fundazioan]], esaterako [[Testu corpus#Zientzia%20eta%20Teknologia%20corpusa%20(ZT)|Zientzia eta Teknologia corpusa]] sortzeko.
 
[[Fitxategi:Lex_Behatokia_pantaila.png|thumb|300x300px|[[Testu corpus#Lexikoaren Behatokia Corpusa (LBC)|Lex,oaren behatokia]] corpusa kontsultatzeko pantaila bat]]
Gainera Euskaltzaindiaren [[Testu corpus#XX. mendeko euskararen corpus estatistikoa|Lexikoaren Behatokia]] egitasmoaren kidea izan da gaur egun, eta bere hasieratik. Lexikoaren Behatokia proiektua Euskaltzaindiaren ekimenez abiatu zen, 2007an, [[Hiztegi Batua|Hiztegi Batuko]] Lantaldeak egindako proposamen bati erantzunez, eta lankidetzan [[Ixa taldea|Ixa Taldearekin]], [[UZEI|UZEIrekin]] eta [[Elhuyar Fundazioa|Elhuyarrekin]]. Proiektuaren emaitza da izen bera duen corpusa, zeina web bidez kontsultatu baitaiteke. 6065 milioi hitzeko testu-corpus bat eratu du 2017ra2018ra arte.<ref>{{Erreferentzia|izena=Komunikazioa eta|abizena=irudia|izenburua=Gaurtik, Lexikoaren Behatokiak 65 milioi testu-hitz eta bilaketa-aukera gehiago ditu|hizkuntza=eu-es|url=https://www.euskaltzaindia.eus/euskaltzaindia/komunikazioa/plazaberri/5721-gaurtik-lexikoaren-behatokiak-65-milioi-testu-hitz-eta-bilaketa-aukera-gehiago-ditu|aldizkaria=www.euskaltzaindia.eus|sartze-data=2019-07-19}}</ref> Corpusa automatikoki prozesatuta dago, eta linguistikoki etiketatuta, eta hizkuntza-corpusek ohikoa duten kontsulta-funtzionalitatea eskaintzen dio erabiltzaileari.<ref>{{Erreferentzia|izena=|abizena=[[Xabier Artola]],
[[Andoni Sagarna]], [[Miriam Urkia]],
[[Nerea Ezeiza]] eta [[Antton Gurrutxaga]]|urtea=2017|izenburua=Lexikoaren Behatokia: leiho bat XXI. mendeko hedabideetako euskarari - IXA Taldea (Atal berezia: Besterena nuen neuregana) - EIZIE|argitaletxea=SENEZ aldizkaria, 48. zk.|orrialdea=|orrialdeak=201-209|ISBN=ISSN:1132-2152|hizkuntza=|url=http://www.eizie.eus/Argitalpenak/Senez/20171102/behatokia|sartze-data=2017-12-11}}</ref><ref>{{Erreferentzia|izena=Euskaltzaindia, Elhuyar Fundazioa, IXA Taldea,|abizena=UZEI|izenburua=Lexikoaren Behatokiaren Corpusa|url=http://lexikoarenbehatokia.euskaltzaindia.eus/cgi-bin/kontsulta.py|sartze-data=2017-12-11}}</ref>