Wikiproiektu:OpenMT2 eta Euskal Wikipedia
Wikiproiektu honen helburua OpenMT2 eta Euskal Wikipedia izeneko itzulpengintza automatikoko (IA) proiektua koordinatzea da.
See Reciprocal Enrichment between Basque Wikipedia and Machine Translators. A chapter of the following book: 'The People’s Web Meets NLP: Collaboratively Constructed Language Resources', book edited by Iryna Gurevych and Jungi Kim, Springer, Book series 'Theory and Aplications of Natural Language Processing', E. Hovy, M. Johnson and G. Hirst (eds.). April 30, 2013 | ISBN-10: 3642350844 | ISBN-13: 978-3642350849.
Proiektuaren helburuak
aldatuEuskal Herriko Unibertsitateko IXA taldeko kideek eta Euskal Wikipediako lankideek hartu dute parte proiektuan 2009 eta 2013 urteen artean.
Helburua bikoitza izan da: Matxin sistema librea hobetzea eta Euskal Wikipedia artikulu berriekin hornitzea. Horretarako, itzulpen automatikoko bi teknika desberdin erabili dira erregeletan oinarritutakoa eta post-edizio estatistikoa:
- Informatikari buruzko 100 artikulu (50.000 bat hitz), Gaztelaniazko Wikipediakoak, automatikoki itzuli dira euskarara Matxin erabiliz.
- Euskarazko testu horiek eskuz zuzendu dira gero, OmegaT erabiliz. (Tresna deskargatzeko eta erabiltzeko eskuliburua)
- Zuzenketak Matxin hobetzeko bildu dira, eta zuzendutako artikuluak Euskal Wikipedian argitaratu dira.
- Artikulu berriak wikitu dira, txantiloiak, barne-loturak, erreferentziak eta kategoriak zuzenduz.
Boluntarioaren lana
aldatuWikiproiektuan parte hartu duten boluntarioen lista behean dago. Horietako bakoitzaren lana hau izan da:
- OmegaT eta Matxin instalatu (Deskargatzeko eta erabiltzeko eskuliburua.pdf)
- Apur bat entrenatzeko, aukeratu artikulu labur bat praktikatzeko beheko listatik , eta landu OmegaT+Matxin tresnarekin:
- Jarri bere izena artikuluaren arduraduna eremuan,
- OmegaT aplikaziotik artikulua automatikoki itzuli Matxin erabiliz,
- Eskuz zuzendu, (Wikipediako formatuak ondo ezagutzen ez bazuen, begiratzen zuen txuleta edo tutorial luze hau)
- eta Wikipediara igo (OmegaT erabiliz ere egin daiteke).
- Aukeratu artikulu ertain edo luze bat ondoko listan, eta lehen bezala automatikoki itzuli, eskuz zuzendu, eta Wikipediara igo.
Proiektuan itzulitako Wikipediako artikuluak.
Proiektuan itzulitako hitzak.
Aurkezpenak
aldatuProiektu osoan egindako lanaren deskribapena
aldatu- Wikipedia eta itzulpen automatikoa: 'Harri batez bizpalau xori' Ekaia aldizkaria, 2013
- (Ingelesez) Reciprocal Enrichment between Basque Wikipedia and Machine Translators. Liburu honetako kapitulu bat: 'The People’s Web Meets NLP: Collaboratively Constructed Language Resources', book edited by Iryna Gurevych and Jungi Kim, Springer, Book series 'Theory and Aplications of Natural Language Processing', E. Hovy, M. Johnson and G. Hirst (eds.). April 30, 2013 | ISBN-10: 3642350844 | ISBN-13: 978-3642350849.
Edizio-maratoia Euskal Wikipediako 10. urteurrenean
aldatu2011eko Wikitzul eguna: Matxin eta Wikipedia hobetzen
aldatuAzalpena bideoan
aldatu- Albisteak 2.0-ren 24. atalean proiektuaren inguruko laburpena dago ikusgai.
2010eko Wikimania kongresuan
aldatu- (Ingelesez) "Reciprocal Enrichment between Wikipedia and Machine Translators" laburpena"
- (Ingelesez) Aurkezpeneko diapositibak
- Iritzi-artikulua Gaur8n
OpenMT2 proiektuaren inguruko informazioa
aldatu- (Ingelesez) OpenMT2 proiektua
Proiektuak sortu dituen baliabideak
aldatu- 3GP, ALGOL, Aplikazio (informatika), Aplikazio bertikal, Aplikazio horizontal, Atzipen sekuentzial, Biltegiratze optiko, COM fitxategi, Common Object Request Broker Architecture, Datu-base eskema, Datu-konpresio, Deka, Delicious, Drupal, Egutegi elektroniko, Eliren liburua, ELIZA programa informatikoa, Emakumeak informatikan, Entitateen izenen ezagutzea, Erregistro, Etiketa (metadatua), Ezagutzaren metodologia, Funtzio boolear, Futbol Club Barcelona (eskubaloia), Gaseosa, Giga, Google itzultzailearen tresnen kutxa, Hans Weingartner, Hardware bidezko azelerazio, Helbide-bus, Hezkuntza-software, Hizkuntzaren ingeniaritza, Hot Potatoes, Ikaskuntzarako ingurune birtualak, Indexazio, Interfaze fisiko, Irudien prozesaketa digital, ISAPI, Itzulpen memoria, Jquery, Kaltura, Karga-efektu, Kilo, Kino (softwarea), Klon (informatika), Kode ireki, Kontsulta lengoaia, Kosinuaren transformatu diskretu, LAMP, League for Programming Freedom, Lego Mindstorms, Lengoaia informatiko, Lerrokatzaile, Lizentzia Publiko Komuna, Logika konputazional, Medikuntza software, Mega, Metalinguistika, Mikro, Murriztapen gramatika, Musikaren deskarga, Nano, Object Query Language, Oihaneko liburua (1967ko filma), Ordenadores Sin Fronteras (erakundea), Pantaila-babesle, Partizio editore, Pasabide (informatika), Peta (aurrizkia), Physics engine, Pico (aurrizkia), Pila (informatika), Programazio konkurrente, Programazio-lengoaien teoria, Red Hat, Renderizazio, Robotika, Runge-Kutta metodo, Sare lokal, Scratch (programazio-lengoaia), Seinale digital, Sistemen diseinua, Slax, Software fabrika, Software modelatzea, Software-errorea, Softwarearen metrika, Softwarezko sintetizadore, Spotify, Superordenagailu, Tera (aurrizkia), Testu-fitxategi, TortoiseSVN, Unity, USB memoria, Verbatim, Virtual Studio Technology, Von Neumannen arkitektura, XLiFF, Yotta, Zubi (informatika)
- Espainiera/euskara corpus paralelo bat. Mozilla softwarearen lokalizazioan sortu denaren bertsio berria. Eskerrak Elhuyarri eta Julen Ruiz-i.
- Testu itzuli eta zuzenduen corpus bat. Espainierazko Wikipediako 100 artikulu horiek Matxin itzultzailearekin sortutako itzulpenak dituena, gure kolaboratzaileek egin dituzten zuzenketekin, noski].
- wikigaiak4koa.pl perl-scripta. Wikipediako kategoria batean dauden artikuluen lista ematen duena. Artikulu bakoitzarekin beste datu batzuk ere ematen dira: ea beste hiru hizkuntzetako Wikipedietan dagoen eta zer luzera duen.
- OmegaT programaren bertsio hobetua, eta berau erabiltzeko eskuliburua.
- Matxin itzultzailearen bertsio berria, informatikako gaiak itzultzeko egokitu duguna (http://ixa2.si.ehu.es/matxin_zerb/translate.cgi). SOAP zerbitzu moduan definituta dago.
Parte-hartzaileak
aldatuItzultzeko artikuluen zerrenda
aldatuArtikulu luzeak
aldatuArtikulu ertainak
aldatuGaztelaniazko Wikipediako artikulua | Hitz-kopurua | Euskarazko Wikipediako artikulua | Hitz-kopurua | Itzulpenaren arduraduna |
3GP | 24.46 Kb | - | - | |
Acreditación_Europea_de_Manejo_de_Ordenador | 23.73 Kb | ez dago | - | - |
Acuerdo_de_nivel_de_servicio | 23.38 Kb | ez dago | - | - |
Administración_de_Memoria | 23.48 Kb | ez dago | - | - |
Advanced_Programmable_Interrupt_Controller | 24.54 Kb | ez dago | - | - |
ALGOL | 29.81 Kb | ALGOL | - | A. Diaz de Ilarraza |
Animación_por_computadora | 23.39 Kb | ez dago | - | joseba.makazaga |
Anomalía_de_Belady | 22.38 Kb | ez dago | - | - |
Archivo_de_texto | 22.66 Kb | ez dago | - | - |
ARJ | 22.46 Kb | ez dago | - | - |
Arquitectura_ARM | 19.57 Kb | ez dago | - | - |
Arte_ASCII | 22.70 Kb | ez dago | - | - |
ARts | 23.47 Kb | ez dago | - | - |
ASP.NET | 76.84 Kb | ez dago | - | - |
Auditoría_informática | 23.35 Kb | ez dago | - | - |
Avidemux | - | ez dago | - | - |
Bastard_Operator_from_Hell | 27.66 Kb | ez dago | - | - |
Beta_tester | 19.99 Kb | ez dago | - | - |
Biblioteca_de_enlace_dinámico | 28.20 Kb | ez dago | - | - |
Botnet | 30.69 Kb | ez dago | - | JesusIbañez |
Bus de direcciones | 304 | 205 | oarbelaitz | |
Bus_VESA | 21.05 Kb | ez dago | - | - |
Byte_(revista) | 22.67 Kb | ez dago | - | - |
CamelCase | 22.21 Kb | ez dago | - | - |
CD-ROM | 43.80 Kb | ez dago | - | - |
Chunk | 18.87 Kb | ez dago | - | - |
COBOL | 35.46 Kb | ez dago | - | - |
Código_Baudot | 22.78 Kb | ez dago | - | - |
Computación_paralela | 23.49 Kb | ez dago | - | JesusIbañez |
Controlador_de_Automatización_Programable | 21.99 Kb | ez dago | - | - |
CP/M | 32.00 Kb | ez dago | - | - |
Decimal_codificado_en_binario | 35.27 Kb | ez dago | - | - |
DDR2 | 31.79 Kb | ez dago | - | - |
Defense_Advanced_Research_Projects_Agency | 25.10 Kb | ez dago | - | - |
Delicious | - | Delicious | - | ksarasola |
Demoscene | 32.85 Kb | ez dago | - | - |
Desbordamiento | 20.00 Kb | ez dago | - | - |
Diccionario_morfológico | 23.35 Kb | ez dago | - | JesusIbañez |
Diseño_asistido_por_computadora | 23.60 Kb | ez dago | - | - |
Distancia_de_Levenshtein | 23.48 Kb | ez dago | - | - |
Dos_(desambiguación) | 23.26 Kb | ez dago | - | - |
DR-DOS | 24.90 Kb | ez dago | - | - |
DXF | 27.03 Kb | ez dago | - | - |
EBCDIC | 28.63 Kb | ez dago | - | - |
EDID | 23.86 Kb | ez dago | - | - |
Eiffel_(lenguaje_de_programación) | 23.82 Kb | ez dago | - | - |
El_Torito_(CD-ROM_Standard) | 90.26 Kb | ez dago | - | - |
Empaquetado_de_aplicaciones | 23.50 Kb | ez dago | - | - |
Enterprise_service_bus | 48.08 Kb | ez dago | - | - |
Especificación | 23.75 Kb | ez dago | - | - |
Fabricación_asistida_por_computadora | 23.91 Kb | ez dago | - | - |
Facultad_de_Informática_de_Barcelona | 24.02 Kb | ez dago | - | - |
Free_Lossless_Audio_Codec | 54.30 Kb | ez dago | - | - |
Garaje_HP | 23.30 Kb | ez dago | - | - |
GD-ROM | 24.70 Kb | ez dago | - | - |
Generador_de_números_aleatorios | 23.74 Kb | ez dago | - | - |
Género de videojuegos | - | ez dago | - | - |
Gobierno_electrónico | 23.18 Kb | ez dago | - | - |
Google Libros | - | ez dago | - | Inaki.a001 |
Google translator toolkit | 555 | Google itzultzailearen tresnen kutxa | 479 | Txibi72 |
GPX | 22.44 Kb | ez dago | - | - |
Graphical_Environment_Manager | 25.20 Kb | ez dago | - | - |
Gzip | 25.02 Kb | ez dago | - | - |
Hiperenlace | 25.02 Kb | ez dago | - | - |
HyperTransport | 33.35 Kb | ez dago | - | - |
IBM_PC_DOS | 22.74 Kb | ez dago | - | - |
Icaros | 18.13 Kb | ez dago | - | - |
Imagen_digital | 22.91 Kb | ez dago | - | - |
Imagen_generada_por_computadora | 23.56 Kb | ez dago | - | - |
IDE | 21.54 Kb | ez dago | - | - |
Imágenes_por_segundo | 23.13 Kb | ez dago | - | - |
Implementación | 23.75 Kb | ez dago | - | - |
Inclusión_digital | 23.14 Kb | ez dago | - | - |
Industria de los videojuegos | - | ez dago | - | - |
Industry_Standard_Architecture | 33.02 Kb | ez dago | - | - |
Information_Technology_Infrastructure_Library | 54.12 Kb | ez dago | - | - |
Ingeniería_asistida_por_computadora | 23.77 Kb | ez dago | - | - |
Infrared_Data_Association | 32.54 Kb | ez dago | - | - |
Ingeniería_informática | 23.39 Kb | ez dago | - | - |
Interfaz | 22.88 Kb | ez dago | - | A. Diaz de Ilarraza |
Interfaz_de_programación_de_aplicaciones | 34.34 Kb | ez dago | - | - |
Internacionalización_y_localización | 24.09 Kb | ez dago | - | - |
Interoperabilidad | 23.04 Kb | ez dago | - | - |
ISAPI | 19.03 Kb | ez dago | - | - |
Joint_Photographic_Experts_Group | 61.21 Kb | ez dago | - | - |
Juego_de_la_vida | 22.91 Kb | ez dago | - | - |
LabWindows/CVI | 25.20 Kb | ez dago | - | - |
Lamer_(informática) | 18.04 Kb | ez dago | - | - |
Lector_de_pantalla | 46.38 Kb | ez dago | - | - |
Leet_speak | 27.26 Kb | ez dago | - | - |
Ley de Acceso Electrónico de los Ciudadanos a los Servicios Públicos | 25.26 Kb | ez dago | - | - |
Licencia Pública Común | 446 | Lizentzia_Publiko_Komuna | 350 | Aingeru |
Logical_block_addressing | 26.36 Kb | ez dago | - | - |
Lookup_table | 41.55 Kb | ez dago | - | - |
Luser | 21.30 Kb | ez dago | - | - |
Magerit | 58.96 Kb | ez dago | - | - |
MagicGate | 23.75 Kb | ez dago | - | - |
Memex | 32.54 Kb | ez dago | - | - |
Memoria_de_traducción | 23.44 Kb | ez dago | - | - |
Memoria_flash | 23.01 Kb | ez dago | - | - |
Método_(informática) | 23.44 Kb | ez dago | - | - |
Metodologia_de_conocimiento | 23.43 Kb | Ezagutzaren metodologia | - | A. Diaz de Ilarraza |
Microsoft_Visual_Studio | 49.88 Kb | ez dago | - | - |
MISD | 21.45 Kb | ez dago | - | - |
Multiprocesamiento_simétrico | 23.44 Kb | ez dago | - | - |
Multiseat | 23.66 Kb | ez dago | - | - |
MXML | 18.55 Kb | ez dago | - | - |
Newbie | 25.35 Kb | ez dago | - | - |
NeXT | 61.56 Kb | ez dago | - | - |
Nibble | 37.11 Kb | ez dago | - | - |
Obtención_de_preferencias | 23.62 Kb | ez dago | - | - |
Oficina_de_servicios | 23.08 Kb | ez dago | - | - |
Operaciones_de_punto_flotante_por_segundo | 32.42 Kb | ez dago | - | - |
Pantalla_azul_de_la_muerte | 23.38 Kb | ez dago | - | - |
Paravirtualización | 23.22 Kb | ez dago | - | - |
PCI_Extensions_for_Instrumentation | 19.96 Kb | ez dago | - | - |
Planificación_de_sistemas_informáticos | 24.13 Kb | ez dago | - | - |
Plug_and_play | 26.84 Kb | ez dago | - | - |
Predictor_de_saltos | 23.08 Kb | ez dago | - | - |
problemas_aritméticos | 23.22 Kb | ez dago | - | - |
Problema_de_la_mochila | 23.30 Kb | ez dago | - | - |
Problema_de_la_galería_de_arte | 23.56 Kb | ez dago | - | - |
Proceso_zombie | 22.96 Kb | ez dago | - | - |
Producción textual colaborativa | - | ez dago | - | - |
Puerta de enlace | 473 | 306 | Utolotu | |
Química_computacional | 77.93 Kb | ez dago | - | - |
RAR | 26.46 Kb | ez dago | - | - |
RatDVD | 24.57 Kb | ez dago | - | - |
Red_de_área_metropolitana | 23.63 Kb | ez dago | - | - |
Registro_(base_de_datos) | 23.40 Kb | Erregistro | - | Ana Arruarte |
Renderización | 832 | 716 | joseba.makazaga | |
Runge-Kutta | 987 | 841 | joseba.makazaga | |
SAMPA | 24.88 Kb | ez dago | - | - |
SCADA | 57.87 Kb | ez dago | - | - |
SDL_(lenguaje_de_especificación) | 23.89 Kb | ez dago | - | - |
Secure_Hash_Algorithm | 29.34 Kb | ez dago | - | - |
SIMD | 22.56 Kb | ez dago | - | - |
Simulación_por_computadora | 23.42 Kb | ez dago | - | - |
Simulación | 32.77 Kb | ez dago | - | - |
Simulink | 22.76 Kb | ez dago | - | - |
Sincronización | 23.05 Kb | ez dago | - | - |
SISD | 21.11 Kb | ez dago | - | - |
Sistema_de_recomendación | 23.39 Kb | ez dago | - | - |
Sistema_digital | 26.49 Kb | ez dago | - | - |
Sistema_secuencial | 23.57 Kb | ez dago | - | - |
Slax | 950 | 652 | utolotu | |
Small_Computer_System_Interface | 34.27 Kb | ez dago | - | - |
Software educativo | - | - | Koru | |
Spotify | - | - | glabaka | |
SRAM | 39.72 Kb | ez dago | - | - |
Sun_SPARC | 45.18 Kb | ez dago | - | - |
SWF | 26.51 Kb | ez dago | - | - |
TANGO | 26.86 Kb | ez dago | - | - |
Tarjeta_perforada | 23.04 Kb | ez dago | - | - |
Tabla_de_Hash_Distribuido | 23.61 Kb | ez dago | - | - |
Transformada_de_coseno_discreta | 23.56 Kb | - | Jesus Aparizio | |
Transmisión_de_datos | 23.31 Kb | ez dago | - | - |
Trie | 27.12 Kb | ez dago | - | - |
UDF | 21.24 Kb | ez dago | - | - |
Unidad_Terminal_Remota | 23.26 Kb | ez dago | - | - |
Unity | 915 | 601 | Utolotu | |
User_Mode_Linux | 22.96 Kb | ez dago | - | - |
UTF-8 | 48.52 Kb | ez dago | - | - |
VINES | 22.74 Kb | ez dago | - | - |
WAMP | 21.52 Kb | ez dago | - | - |
Waveform_Audio_Format | 31.20 Kb | ez dago | - | - |
Windows_bitmap | 466 | ez dago | - | - |
Write_Once_Read_Many | 23.19 Kb | ez dago | - | - |
ZFS_(sistema_de_archivos) | 1748 | ZFS | 69 | - |
Guztira: 167 artikulu ertain | - | - | - | - |