Ana Zelaia Jauregi: berrikuspenen arteko aldeak

Ezabatutako edukia Gehitutako edukia
No edit summary
Ksarasola (eztabaida | ekarpenak)
→‎Ikerlaria: Erreferentzia
11. lerroa:
 
== Ikerlaria ==
[[2016|2016an]] defenditu zuen doktore-tesian lehen urratsak egin zituen berak euskararako hizkuntzaren prozesamendua eta Ikasketa automatikoa uztartzeko. Tesiaren zuzendariak [[Olatz Arregi]] eta [[Basilio Rueda]] irakasleak izan ziren. Tesiaren izenburu osoa hau izan zen: "''Latent semantic indexing eta ikasketa automatikoa hizkuntzaren prozesamenduaren arloan: testu-sailkatzea, hitzen adiera-desanbiguatzea eta korreferentzia-ebaztea svd bidezko dimentsio murrizketa eta multi-sailkatzailea konbinatuz''".<ref>{{Erreferentzia|izenburua=Tesis / Tesia: Latent semantic indexing eta ikasketa automatikoa… (A. Zelaia, 2016/01/25)|hizkuntza=eu|url=https://www.ehu.eus/ehusfera/ifbloga/2016/01/21/tesis-tesia-latent-semantic-indexing-eta-ikasketa-automatikoa-a-zelaia-20160125/|aldizkaria=DIFusio@, EHUko Informatika|sartze-data=2022-04-23}}</ref>
 
Ordurako [[Ezkutuko semantikaren analisia|LSI]] teknikak (''Latent semantic indexing'', [[Ezkutuko semantikaren analisia]]) hitzen eta testuen semantika jasotzeko erakutsitako trebezia ikusita, hark kalkulatutako adierazpen matematikoa [[Ikasketa automatiko|Ikasketa Automatikoko]] metodoekin uztartuz, [[Hizkuntzaren prozesamendu|Hizkuntzaren Prozesamenduaren]] hainbat atazaren ebazpenerako prozedura bat diseinatu zuten, haren portaera eta ekar zezakeen onura aztertzeko.<ref name=":0">{{erreferentzia|izena=Ana|abizena=Zelaia Jauregi|urtea=2016|izenburua=Latent semantic indexing eta ikasketa automatikoa hizkuntzaren prozesamenduaren arloan: testu-sailkatzea, hitzen adiera-desanbiguatzea eta korreferentzia-ebaztea svd bidezko dimentsio murrizketa eta multi-sailkatzailea konbinatuz|argitaletxea=TESIKER, euskarazko tesiak (euskadi.eus)|hizkuntza=eu|url=https://www.euskadi.eus/web01-apdoktes/eu/w10aTesDocWar/tesisDoctoralJSP/w10aVerFichaTesisDoctoralLookUpDispath.do}}</ref><ref>{{Erreferentzia|izena=Ana|abizena=Zelaia Jauregi|urtea=2016|izenburua=Latent semantic indexing eta ikasketa automatikoa hizkuntzaren prozesamenduaren arloan: testu-sailkatzea, hitzen adiera-desanbiguatzea eta korreferentzia-ebaztea svd bidezko dimentsio murrizketa eta multi-sailkatzailea konbinatuz|argitaletxea=UPV/EHU|hizkuntza=eu|url=https://www.educacion.gob.es/teseo/mostrarRef.do?ref=1344708|aldizkaria=www.educacion.gob.es|sartze-data=2022-04-22}}</ref> [[Ezkutuko semantikaren analisia]] (LSI) testuen semantika jasotzeko gaitasuna duen tresna bat da. Oinarri matematikoa du, eta bi teknika konbinatzen ditu, [[Aljebra lineal|aljebra linealeko]] [[Bektore espazio|bektore-espazioak]], batetik, eta matrize-deskonposaketarako [[Singular Value Decomposition]] (SVD) metodoa, bestetik. Testu multzo (corpus) batetik abiatuta sortzen da espazio semantikoa eta bertan kokatzen dira hitzak eta testu zatiak adierazten dituzten bektoreak. Espazioaren [[Matrizen dimentsio-murrizte|dimentsioa murriztean]] hitzen eta testu-zatien arteko erlazio semantikoak hobeto erakustea lortzen da. Bektoreen arteko angeluaren kosinua erabiltzen da haien arteko konparaketa semantikoak egiteko; horrela, hitzek edo testuek duten antzekotasun semantikoa neur daiteke. Konputagailuek ikasteko gaitasuna garatzea helburu duen informatikaren alorra da [[Ikasketa automatiko|Ikasketa Automatikoa]], makinak ere giza adituek erakusten duten trebeziarekin problemak ebazteko eta erabakiak hartzeko gai izan daitezen. Ikasketa automatikoko metodoak azken urteotan Hizkuntzaren Prozesamenduaren hainbat atazatan oso lagungarriak gertatzen ari dira.<ref name=":0" />