Wikiproiektu:Euskarazko albisteetako Izen Entitateak
Sarrera
aldatuHemen topatuko duzun edukia, euskaraz argitaratzen duten hainbat hedabide digitaletatik erauzia dago. Euskarazko albiste bakoitzaren pertsonen izen entitateak automatikoki jaso dira, asteko pertsonaia aipatuenak zentzuk diren erakusteko aukera emanez. Astelehenero, pasa den asteko 10 entitate nabarmenenak automatikoki publikatuko dira. Horretarako, azkeneko asteko izen entitateak bestelako izen entitate guztiekin konparatzen dira, berrienak direnak aukeratuz. Azkeneko lau asteetako pertsonaiak etengabe eguneratzen joango dira eta zaharragoak direnak bukaerako menu zabalgarrian gordeta geratuko dira. Horrez gain, bistaraketa interaktibo bat sortu da, pertsonaia berri zein ohikoen arteko erlazioak erakusten dituena.
Metodologia
aldatuLan honen sorkuntzan erabilitako metodologiak hainbat pausu ditu: hedabide digitalen identifikazioa, hedabideen entzuketa bitartez albisteak jasotzea, albisteetatik izen entitateak erauztea eta azkeneko astean nabarmenak izan diren entitateen aukeraketa.
- Euskarazko hedabideen eskuzko identifikazioa: Euskal Herrian euskaraz aritzen diren 8 komunikabide digital identifikatu dira.
- Hedabideen entzuketa: MSM crawlerra erabili da hedabideen RSS loturak jasotzeko. Hedabide ezberdinetatik berri jarioa jaso, garbitu eta gorde da corpus batean. Jasotako albiste bakoitzetik egunkaria, data, hizkuntza, titularra, edukia eta lotura gorde dira.
- Izen entitateen erauzketa: Lehenik eta behin, entzuketan euskarazko, gaztelerazko eta frantsesezko albisteak lortzen direnez, soilik euskarazko albisteak aukeratuko dira, beste guztiak alboratuz. Euskarazko albiste bakoitzaren edukia tokenizatu, lematizatu eta izen entitateen detektoreaz aztertu da. Hiru fase hauetatik eratorritako entitate izendunak jaso ostean, albiste bakoitzaren izen entitateak gorde dira.
- Izen entitateen aukeraketa: Euskarazko albiste guztietatik, izen entitate berrienak eta nabarmenenak aukeratzeko tf-idf banaketan oinarritu gara. Banaketa horri esker, azkeneko asteko izen entitateak beste guztiekin konparatzen dira, ohikoak diren izen entitateak alboratu eta azkeneko astean nabarmenak direnak jasotzeko asmoz.
Esteka interaktiboa
aldatuAstero adierazgarrienak diren Izen Entitateak aurkitzeaz gain, interesgarria iruditu zaigu bistaraketa berezi bat proposatzea izen entitateen maiztasuna eta berritasuna haintzat hartzen dituena. Scattertext teknikari esker, izen entitate berrienak nabarmendu ahalko ditugu zaharrenetatik. Horrez gain izen entitate aipatuenak eta gutxi aipatuenen arteko ezberdintasuna ikusi ahal izango da aldi berean. Adierazpen grafiko hau egunero berrituko da, iragandako 7 egunetako datuak eta azkeneko hilabeteko datuak konparatuta, izen entitateak sailkatu eta agerpenen iturria ikusteko aukera emanez.
Bistaraketaren adierazpen grafikoan izen entitateen banaketa topatu dezakegu, denboraren eta agerpen kopuruaren arabera. Era honetan, bi dimentsioetako grafikoaren goiko erdian estitate berri eta ohikoenak topatu ditzakegu. Aldi berean, grafikoaren eskubi aldean estitate zahar ohikoenak topatuko dira. Halaber, entitate berri aipatuenak grafikako goiko eskubiko koadrantean aurkitu ahal izango ditugu, azkeneko astean aipatuenak izan diren entitateak izango dira hauek. Bestalde, ezkerreko goiko koadrantean beti aipatuak diren entitateak kokatuko dira, hau da, ohikoenak. Eskubiko beheko koadrantean, ostera, albiste zaharretan ohikoak izan diren eta albiste berrietan agerpen txikia daukatenak azaltzen dira.
Bistaratze sistema honek izen entitateen bilatzaile bat dauka ere, entitatea grafikoan kokatzeaz gain, bere agerpen guztiak emango dizkigu. Agerpenetan egunkaria, eguna, albistera lotura eta albistean agertzen diren bestelako entitateak edukiko ditugu. Era honetan, entitate bakoitzaren informazio ahalik eta osatuena lortuko dugu, bere agerpenen testuingurua erakutsiko duen bistaratze bat eskainiz.
MAPA INTERAKTIBORA ESTEKA
2024-10-14ko asteko izen entitateak
aldatuIzena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Iker Badiola Etxaburu | ||||||
Maria Aranda | ||||||
David de Las Heras | ||||||
Onintza Alustiza | ||||||
Koldo Garciar | ||||||
Seve Atencia | ||||||
Ana Guadalupe Fernández | ||||||
Carlus Padrissa | d:Q8339236 | Zirriborroa | ||||
Paula Sáenz de Valluerca | ||||||
Madame Señorita |
2024-10-07ko asteko izen entitateak
aldatuIzena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Laida Arbizu Agirre | d:Q126935818 | Zirriborroa | ||||
Alaitz Etxaide | ||||||
Alaitz Etxabide Etxeberria | ||||||
Genoveva Galarza | ||||||
Maggie Glass | ||||||
Gael Goer | ||||||
Thomas Francis Meagher | d:Q522396 | Zirriborroa | ||||
Iraitz Amor Pla | ||||||
John F Kennedy | ||||||
Robin Crusoe |
2024-09-30ko asteko izen entitateak
aldatuIzena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Jon Hidalgo Gereñu | ||||||
Ibrahim Muhammad Kabisi | ||||||
Joana Santos | ||||||
Jennifer Moorehead | ||||||
Mikel Larraza | ||||||
Leire Amenabar | ||||||
Celeste Agüero | ||||||
Beñat Zamalloa | ||||||
Marijo Arrieta | ||||||
Lidia de Lorenzo |
2024-09-23ko asteko izen entitateak
aldatuIzena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Aratz Irazustabarrena | ||||||
Lorea Argarate Zubia | ||||||
Marta G | ||||||
Oier Etxeberria Zubimendi | ||||||
Ryan Wesley Routh | d:Q130304876 | Zirriborroa | ||||
jaso *edun | ||||||
Gladys saria | d:Q110869387 | Zirriborroa | ||||
Lorea Argarate zubi | ||||||
Sabrina Ceballos Sánchez | ||||||
Jaione Garcia Sanesteban |