Hitz-zaku eredu: berrikuspenen arteko aldeak

Ezabatutako edukia Gehitutako edukia
tNo edit summary
1. lerroa:
'''Hitz-zaku''' edo '''bag-of-words''' eredua [[Informazioa eskuratzea|informazioaren berreskuratze]] eta [[Hizkuntzaren prozesamendu|hizkuntzaren prozesamenduan]] erabilitako testu adierazpen bat da. Adierazpen honetan, testu bat (adibidez dokumentu edo esaldi bat) barnean dituen hitzen zaku edo [[multimultzo]] bat bezala adierazten da, hau da, hitzen arteko ordena eta harremana baztertzen da, baina agerpen kontaketak mantentzen dira. Hitz-zaku eredua ikusmen artifizialean ere erabilia izan da. <ref name="sivic">{{cite conference|first=Josef|last=Sivic|title=Efficient visual search of videos cast as text retrieval|booktitle=IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 31, NO. 4|pages=591–605|publisher=IEEE|date=April 2009|url=http://www.di.ens.fr/~josef/publications/sivic09a.pdf}}</ref>
 
Hitz-zaku eredua askotan [[Dokumentuen sailkapena|dokumentuen sailkapensailkapenean]] erabiltzen da, non hitz bakoitzaren agerpen kontaketa sailkatzailearen entrenamendu datu bezala erabiltzen den. <ref> McTear et al 2016, p. 167. </ref>
 
“Hitz-zaku” terminoaren erabilera goiztiar bat Zellig Harris-en 1954ko ''Distributional Structure'' artikuloan aurki daiteke.<ref>{{Cite aldizkari|author=Harris|first=Zellig|year=1954|title=Distributional Structure|volume=10|pages=146–62}}</ref>