Euskararen Datu Base Lexikala: berrikuspenen arteko aldeak

Ezabatutako edukia Gehitutako edukia
Ksarasola (eztabaida | ekarpenak)
estekak zuzenketak
Ksarasola (eztabaida | ekarpenak)
→‎Antolaketa: Antolaketa
17. lerroa:
 
== Antolaketa ==
Teoria linguistiko desberdinekiko neutrala, malgua, irekia eta erabilterraza izanik, corpusekin batera, [[Hizkuntzaren prozesamendu|hizkuntzaren prozesamenduko]] (HP) lanetarako ezinbesteko tresna da. 125.000075 batsarrera sarrerazditu osaturikbakoitza dagobere informazio morfologikoarekin, hiru atal nagusitan banatuta: <ref name=":2" />

* 104.116 hiztegi-sarreraksarrera (hiztegi konbentzional batean aurkitzen direnak bezalakoxeak), aditz-formak eta morfema: ez-independenteak"etxe", bakoitza bere informazio morfologikoarekin"madari"...)
* 20.599 [[forma flexionatu]] (aditz-formak: "dut", "nintzen", "niezaion"...)
* 355 [[morfema ez-independente]]. Atzizkiak edo aurrizkiak eurak bakarrik hitz oso bat osatzerik ez dutenak dira horiek. Adibidez, “lako” atzizkia erabil dezakezu “delako”, “naizelako” edo “nintzelako” hitzak osatzeko, baina “lako” hori ez da inoiz hitz oso bat.
 
Forma guzti horien artean 6.581 [[Unitate lexikal ez-estandar|unitate ez-estandarrak]] dira, adibidez “eritzi”, Batuan onartuta dauden unitateak estandarrak dira, adibidez “iritzi” estandarra da, eta “eritzi” ez da estandarra.
 
Forma guzti horien artean 2.209 [[hitz anitzeko unitate lexikal]] dira, adibidez, "aditzera eman", "botoi-zulo", "hain zuzen ere"... <ref>{{Erreferentzia|izenburua=Euskarazko hitz anitzeko unitate lexikalen tratamendu konputazionala {{!}} Ixa taldea|url=http://ixa.si.ehu.es/node/3333?language=eu|aldizkaria=ixa.si.ehu.es|sartze-data=2020-05-13}}</ref>
 
== Oinarrizko teknologia ==