Web-meatzaritza (ingelesez, Web mining) Webetik patroiak deskubritzeko datu-meatzaritza tekniken aplikazioa da. Analisiaren helburuaren arabera, hiru mota ezberdindu daitezke: Web erabileraren meatzaritza, Web edukien meatzaritza eta Web egituraren meatzaritza.

Web erabileraren meatzaritza aldatu

Web erabileraren meatzaritza erabiltzaileak webeko datuekin egiten duen erabilera aztertu eta deskubritzeko datu-meatzaritza aplikatzean datza. Erabiltzaileak webgune batean nabigatu eta ekintzak burutzen dituenean gordetzen dira erabilera datuak. Web zerbitzari bat edo gehiagotik patroien ezagutze automatikoa beharrezkoa du. Erakundeen datu kopuru handiak sortu eta gordetzen dituzte; informazio gehiena web zerbitzariek automatikoki sortzen dituzte eta bertako log fitxategian gordetzen da. Datu horiek aztertzeak laguntza handia eskaini diezaioke erakundeari bere bezeroak ezagutu ahal izateko.

Web erabileraren meatzaritzarako prozesua aldatu

  • Arazoaren identifikazioa
  • Datuak jasotzea
  • Datuen aurreprozesamendua
  • Patroien deskubrimendu eta analisia

Web edukien meatzaritza aldatu

Web edukien meatzaritza web orrialde baten edukitik informazio erabilgarria erauztean datza. Web edukia mota ezberdinetakoa izan daiteke, hala nola testua, irudiak, soinua edo bideoa. Web edukien meatzaritza testu meatzaritza izenez ezagutzen da askotan, testuzko edukiak direlako ikerketa arlo honetan zabalduena. Web edukien meatzaritzan erabilitako teknologia ohikoenak lengoaia naturalen prozesamendua eta informazioa eskuratzea (edo zehatzago, informazio erauzketa) dira.

Web egituren meatzaritza aldatu

Web egituren meatzaritza webgune baten nodo eta konexioen egitura aztertzeko grafikoen teoria erabiltzean datza. Webean egituratutako datuen ezaugarriak kontuan izanik, web egituren meatzaritzaren barruan bi mota ezberdindu daitezke.

Lehena hiperloturetatik patroiak lortzea da. Hiperlotura bat web orrialde bat beste leku batekin lotzen duen egitura elementua da. Eta bigarrena, dokumentuen egituran oinarritzen da. Web orrialde baten HTML edo XML kodea aztertzeko zuhaitz erako egitura erabiltzen da.

Web meatzaritzaren aplikazioak aldatu

  • E-commerce
  • Bilaketa motoreak
  • Pertsonalizazioa
  • Webguneen diseinua

Baliabideak aldatu

Liburuak aldatu

Erreferentziak aldatu

Kanpo estekak aldatu

Softwarea aldatu

Erlazionatutako konferentziak aldatu