Euskararen Datu Base Lexikala: berrikuspenen arteko aldeak
Ezabatutako edukia Gehitutako edukia
estekak zuzenketak |
→Antolaketa: Antolaketa |
||
17. lerroa:
== Antolaketa ==
Teoria linguistiko desberdinekiko neutrala, malgua, irekia eta erabilterraza izanik, corpusekin batera, [[Hizkuntzaren prozesamendu|hizkuntzaren prozesamenduko]] (HP) lanetarako ezinbesteko tresna da. 125.
* 104.116 hiztegi- * 20.599 [[forma flexionatu]] (aditz-formak: "dut", "nintzen", "niezaion"...)
* 355 [[morfema ez-independente]]. Atzizkiak edo aurrizkiak eurak bakarrik hitz oso bat osatzerik ez dutenak dira horiek. Adibidez, “lako” atzizkia erabil dezakezu “delako”, “naizelako” edo “nintzelako” hitzak osatzeko, baina “lako” hori ez da inoiz hitz oso bat.
Forma guzti horien artean 6.581 [[Unitate lexikal ez-estandar|unitate ez-estandarrak]] dira, adibidez “eritzi”, Batuan onartuta dauden unitateak estandarrak dira, adibidez “iritzi” estandarra da, eta “eritzi” ez da estandarra.
Forma guzti horien artean 2.209 [[hitz anitzeko unitate lexikal]] dira, adibidez, "aditzera eman", "botoi-zulo", "hain zuzen ere"... <ref>{{Erreferentzia|izenburua=Euskarazko hitz anitzeko unitate lexikalen tratamendu konputazionala {{!}} Ixa taldea|url=http://ixa.si.ehu.es/node/3333?language=eu|aldizkaria=ixa.si.ehu.es|sartze-data=2020-05-13}}</ref>
== Oinarrizko teknologia ==
|