Wikiproiektu:Euskarazko albisteetako Izen Entitateak
Sarrera aldatu
Hemen topatuko duzun edukia, euskaraz argitaratzen duten hainbat hedabide digitaletatik erauzia dago. Euskarazko albiste bakoitzaren pertsonen izen entitateak automatikoki jaso dira, asteko pertsonaia aipatuenak zentzuk diren erakusteko aukera emanez. Astelehenero, pasa den asteko 10 entitate nabarmenenak automatikoki publikatuko dira. Horretarako, azkeneko asteko izen entitateak bestelako izen entitate guztiekin konparatzen dira, berrienak direnak aukeratuz. Azkeneko lau asteetako pertsonaiak etengabe eguneratzen joango dira eta zaharragoak direnak bukaerako menu zabalgarrian gordeta geratuko dira. Horrez gain, bistaraketa interaktibo bat sortu da, pertsonaia berri zein ohikoen arteko erlazioak erakusten dituena.
Metodologia aldatu
Lan honen sorkuntzan erabilitako metodologiak hainbat pausu ditu: hedabide digitalen identifikazioa, hedabideen entzuketa bitartez albisteak jasotzea, albisteetatik izen entitateak erauztea eta azkeneko astean nabarmenak izan diren entitateen aukeraketa.
- Euskarazko hedabideen eskuzko identifikazioa: Euskal Herrian euskaraz aritzen diren 8 komunikabide digital identifikatu dira.
- Hedabideen entzuketa: MSM crawlerra erabili da hedabideen RSS loturak jasotzeko. Hedabide ezberdinetatik berri jarioa jaso, garbitu eta gorde da corpus batean. Jasotako albiste bakoitzetik egunkaria, data, hizkuntza, titularra, edukia eta lotura gorde dira.
- Izen entitateen erauzketa: Lehenik eta behin, entzuketan euskarazko, gaztelerazko eta frantsesezko albisteak lortzen direnez, soilik euskarazko albisteak aukeratuko dira, beste guztiak alboratuz. Euskarazko albiste bakoitzaren edukia tokenizatu, lematizatu eta izen entitateen detektoreaz aztertu da. Hiru fase hauetatik eratorritako entitate izendunak jaso ostean, albiste bakoitzaren izen entitateak gorde dira.
- Izen entitateen aukeraketa: Euskarazko albiste guztietatik, izen entitate berrienak eta nabarmenenak aukeratzeko tf-idf banaketan oinarritu gara. Banaketa horri esker, azkeneko asteko izen entitateak beste guztiekin konparatzen dira, ohikoak diren izen entitateak alboratu eta azkeneko astean nabarmenak direnak jasotzeko asmoz.
Esteka interaktiboa aldatu
Astero adierazgarrienak diren Izen Entitateak aurkitzeaz gain, interesgarria iruditu zaigu bistaraketa berezi bat proposatzea izen entitateen maiztasuna eta berritasuna haintzat hartzen dituena. Scattertext teknikari esker, izen entitate berrienak nabarmendu ahalko ditugu zaharrenetatik. Horrez gain izen entitate aipatuenak eta gutxi aipatuenen arteko ezberdintasuna ikusi ahal izango da aldi berean. Adierazpen grafiko hau egunero berrituko da, iragandako 7 egunetako datuak eta azkeneko hilabeteko datuak konparatuta, izen entitateak sailkatu eta agerpenen iturria ikusteko aukera emanez.
Bistaraketaren adierazpen grafikoan izen entitateen banaketa topatu dezakegu, denboraren eta agerpen kopuruaren arabera. Era honetan, bi dimentsioetako grafikoaren goiko erdian estitate berri eta ohikoenak topatu ditzakegu. Aldi berean, grafikoaren eskubi aldean estitate zahar ohikoenak topatuko dira. Halaber, entitate berri aipatuenak grafikako goiko eskubiko koadrantean aurkitu ahal izango ditugu, azkeneko astean aipatuenak izan diren entitateak izango dira hauek. Bestalde, ezkerreko goiko koadrantean beti aipatuak diren entitateak kokatuko dira, hau da, ohikoenak. Eskubiko beheko koadrantean, ostera, albiste zaharretan ohikoak izan diren eta albiste berrietan agerpen txikia daukatenak azaltzen dira.
Bistaratze sistema honek izen entitateen bilatzaile bat dauka ere, entitatea grafikoan kokatzeaz gain, bere agerpen guztiak emango dizkigu. Agerpenetan egunkaria, eguna, albistera lotura eta albistean agertzen diren bestelako entitateak edukiko ditugu. Era honetan, entitate bakoitzaren informazio ahalik eta osatuena lortuko dugu, bere agerpenen testuingurua erakutsiko duen bistaratze bat eskainiz.
MAPA INTERAKTIBORA ESTEKA
2024-04-22ko asteko izen entitateak aldatu
Izena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Gabriel Cuesta | ||||||
Döner Kebab | ||||||
Carlos Osinaga | ||||||
Diego Carral | ||||||
Andoni Bengoetxea | ||||||
Alexander Garcia Galas | ||||||
Marina León | ||||||
Raquel Andrés Durà | ||||||
Zapatero Rajoy | ||||||
Catalina Guilerna |
2024-04-15ko asteko izen entitateak aldatu
Izena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Altuna Martija | ||||||
san Joan | d:Q924932 | Zirriborroa | ||||
Begoña de Ibarra | ||||||
Ainhoa Gorriz | ||||||
Balentin Kortazar | ||||||
Margarita Tarragona | ||||||
Rosa Luxenburg | ||||||
Angel Maria Villar | ||||||
Joseba Egiguren | ||||||
Aritza Urrengoetxea |
2024-04-08ko asteko izen entitateak aldatu
Izena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Ignacio López Goñi | ||||||
Ainhoa de Las Heras | ||||||
Mathias Fekl | ||||||
Eric Morvan | ||||||
Jean Noel Etcheverry Txetx | ||||||
Angel Salas Larrazabal | ||||||
Salas Larrazabal | ||||||
Sylviane Alaux | d:Q3507235 | Zirriborroa | ||||
Matthias Fekl | d:Q3299831 | Zirriborroa | ||||
Éric Morvan | d:Q36697073 | Zirriborroa |
2024-04-01ko asteko izen entitateak aldatu
Izena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Fermín Martikorena | ||||||
Jean René Iturbide | ||||||
Peio Martikorena | ||||||
Mathieu Bergè | ||||||
Markus Söder | d:Q50664 | Zirriborroa | ||||
Francisco Javier Masid Balda | ||||||
Mikel Arana Ibabe | ||||||
Kike Pérez de Arriba Díaz de Argandoña | ||||||
Kristina Azazeta Urueña | ||||||
Julia López Fernández |