Ezagutzaren metodologia

Ezagutzaren metodologiak hiru motatako informazioak identifikatzen ditu gomendatze-sistemak erabil ditzan:

Ezagutza-metodologiaren eskema orokorra
1. Erabiltzaileen informazio demografikoa: adina, generoa, bizilekua ...
2. Produktuaren ezaugarrien araberako erabiltzaileen lehentasunak: pelikula mota, zuzendaria, aktore nagusia ...
3. Aurretiko esperientziak: erosketa-ebaluazioak ...

Informazio honen datu-basearen gainean, erabiltzaileak hainbat produkturekin duen zaletasuna kalkulatzen da eta gero erabiltzaileari gomendatzen zaizkio zaletasun handieneko produktuak . Informazio egoki, zehatz eta zuzena ematen duten iturburuak, garrantzirik gabeko informazioa ematen duten iturburuak baino maizago erabiliko direla espero da.

Motibazioa aldatu

Erronka garrantzizkoenetako bat bai merkaturatze sistema batean edo gomendatze sistema batean bezeroari buruzko edo produktu baten bezeroari buruzko edo zerbitzu bateko erabiltzaileari buruzko informazio baliagarria eskuratzea da. Oro har, lehen urratsa informazioa bilatzea da eskura dagoen edozein iturburu bat analizatuz. Hala ere, sortzen den arazo nagusia informazio horren erabilgarritasuna da. Hortaz, a priori, gomendioetarako informazioaren egokitasunari buruzko probak emango dituen mekanismo bat beharrezkoa da. Datu eskuragarri andanaren gainean bilaketa bukaezinak saihesteko, horrelakoetan baliabide gehiegi erabiltzen direla kontuan hartuta, informazioak aldez aurretik sailkatuta edo indexatuta egon behar du erraz aurkitzeko. Metodologia hau informazio-iturburu egituratuetarako bereziki definitu da.

Prozesuaren urratsak aldatu

  1. Iturburuetako informazioaren pertinentzia neurtzeko ezaugarri multzoa lortzea: ezaugarri hauek iturburu esanguratsua beste batzuekin konparatzea ahalbideratu behar dute.
  2. Iturburu fidagarriena hautatzeko neurri bat lortzea: iturburu baten konfiantza iturburu horrekin aurretik proposatutako gomendio emaitzetatik lortzen da.
  3. Iturburu egokienaren aukeraketa: eskura dagoen iturburu bakoitzaren egokitasun-neurria kalkulatzen da 1. urratsean lortutako pertinentzia-neurria eta 2 atalean lortutako fidagarritasun-balioa erabiliz. Honek gomendioetarako zer iturburu diren egokienak erabakitzeko balio du, era justifikatu batean.

Pertinentzia edo garrantziaren lorpena (R(S)) aldatu

Iturburu bat zer punturaino den egokia jakiteko hainbat ezaugarri aztertu behar ditugu:

  • OSOTASUNA: eskuragarri dauden iturburuetatik erabiltzaileekin erlazionatutako informazioa lortzea da helburua. Erabiltzaile guztiei buruzko informazioa daukan datu-basea erabiltzaile batzuena bakarrik daukana baino osatuago izango da.

Emanda gomendatze-domeinu bateko   erabiltzaile multzoa,   iturburu baten osotasuna (I),   iturrian ez dauden   multzoko erabiltzaile kopurua ( -ren bitartez ezagutzen dena) zati erabiltzaileen kopurua   da.

 
  • DIBERTSITATEA: iturburuetan dauden informazio demografikoa ezagutzea ahalbideratzen du. Gomendatze sistemek informazio hau erabiltzen dute talde osoei genero, bizileku, adina ... ezaugarrien arabera gomendioak emateko. Iturburua, zenbat eta bariatuago izan, erabiltzaile talde gehiagorako balioko dute.

Dibertsitatea ( D) entropia bezala kalkulatzen da, non   eta,   bakoitza,   taldeko erabiltzaileak diren eta  ,   iturburuaren erabiltzaileen kopuru osoa.

 
  • MAIZTASUNA: iturburuaren informazio kantitatea jakiteko laguntzen du. Iturburu batek erabiltzaileekiko interakzioen bitartez informazioa eskuratzen du, hau da, erabiltzaileekiko interakzioa zenbat eta maizago izan orduan eta osoago izango da. Gainera, portaera, erosketa edo zenbat eta informazio gehiago izan erabiltzaileen ebaluazioei buruz, orduan eta zehatzagoak izango dira gomendioak.

Iturburua iterazio kopuruen arabera kategorietan banatzen dira:

  kategoria: 1-10 elkarrekintza
  kategoria: 11-25 elkarrekintza
  kategoria: 26-50 elkarrekintza
  kategoria: 51-100 elkarrekintza
  kategoria: 101-200 elkarrekintza
  kategoria: +201 elkarrekintza

  iturburuaren elkarrekintzen (F) maiztasuna,   kategoriak emanda, kategoria horien   pisuen batura da bakoitza bere   kopuruarekin ponderatuta, zati   iturburuko   erabiltzaile kopurua.

 
  • PUNTUALITATEA: iturburuen ahalmena informazio eguneratua izateko, erabiltzaileen gogoak eta lehentasunak denborarekin alda daitezkeela kontuan hartuta. Orain dela 10 urte gustuko filmak eta oraingoak desberdinak izan daitezke, baina orain dela 2 urtekoek haiek baino probabilitate gehiago dute orain gustukoak direnak izateko.

Iturburuekin erabiltzaileak ibili diren denboraldia kontuan hartuta ere kategoriak ezarri daitezke:

  kategoria: 2006/01/01 - 2006/12/31
  kategoria: 2007/01/01 - 2007/12/31
  kategoria: 2008/01/01 - 2008/12/31
  kategoria: 2009/01/01 - 2009/12/31
  kategoria: 2010/01/01 - 2010/12/31
  kategoria: 2011/01/01 - 2011/12/31

  iturburuko interakzioen (P) puntualitatea,   kategoriak emanda,   pisuen batura da,   faktoreaz biderkatuta, eta zati   iturburuko   erabiltzaile kopurua.

 

Azkenean garrantziaren neurria lortzen dugu:

  • ATRIBUTU GARRANTZITSUEN KOPURUA: nahiz eta iturburua osoa izan, erabiltzaileei buruzko informazio kantitatea handia izan, eta eguneratuta egon, beharbada informazio hori ez da zehatza gomendioak egiteko. Atributu pertinenteen kantitatea beste ezaugarri bat da iturburu batean behar dugun informazioa aurkitzen den ala ez adierazten duena.

Gomendioa egitea ahalbideratzen duten   attributu multzoa emanda,   iturburuko (R) atributu garrantzitsu kopurua honela definitzen da:   izeneko  rik gabeko atributu kopurua zati   atributu kopuru osoa.

 

Fidagarritasunaren lorpena (T(S)) aldatu

Iturri baten fidagarritasuna bere informazioa erabiltzeagatik ebaluatua izateko 0 eta 1en arteko probabilitate balio bat da. Balio hau iturburuetatik lehenagotik lortutako konfiantza ezaugarrian oinarritzen da. Gomendioen arrakastaren maila kalkulatzeko beharrezko informazioa gordetzen da, iturburu arrakastatsua (= 1) edo ez arrakastatsua (= 0) izan den informazioaren bitartez.

Iturburu egokien eta fidagarriena aukeraketa aldatu

Algoritmoak hiru elementu ditu:

1. Iturburu hautagaien multzo bat (S).
2. Iturburu egokienak (relevant ingelesez) eta fidagarrienak (trust ingelesez) aukeratzeko (R(S), T(S)) funtzioa.
3. Funtzio honek parametroa duen iturburuaren T partaidetza eta R konfiantza parametroen balioak erabiltzen ditu.
4. Iturburu aukeratuak dauzkan (F) soluzio multzoa.


  

Erreferentziak aldatu

Kanpo estekak aldatu