Wikiproiektu:OpenMT2 eta Euskal Wikipedia
Wikiproiektu honen helburua OpenMT2 eta Euskal Wikipedia izeneko itzulpengintza automatikoko (IA) proiektua koordinatzea da.
See Reciprocal Enrichment between Basque Wikipedia and Machine Translators. A chapter of the following book: 'The People’s Web Meets NLP: Collaboratively Constructed Language Resources', book edited by Iryna Gurevych and Jungi Kim, Springer, Book series 'Theory and Aplications of Natural Language Processing', E. Hovy, M. Johnson and G. Hirst (eds.). April 30, 2013 | ISBN-10: 3642350844 | ISBN-13: 978-3642350849.
Proiektuaren helburuakAldatu
Euskal Herriko Unibertsitateko IXA taldeko kideek eta Euskal Wikipediako lankideek hartu dute parte proiektuan 2009 eta 2013 urteen artean.
Helburua bikoitza izan da: Matxin sistema librea hobetzea eta Euskal Wikipedia artikulu berriekin hornitzea. Horretarako, itzulpen automatikoko bi teknika desberdin erabili dira erregeletan oinarritutakoa eta post-edizio estatistikoa:
- Informatikari buruzko 100 artikulu (50.000 bat hitz), Gaztelaniazko Wikipediakoak, automatikoki itzuli dira euskarara Matxin erabiliz.
- Euskarazko testu horiek eskuz zuzendu dira gero, OmegaT erabiliz. (Tresna deskargatzeko eta erabiltzeko eskuliburua)
- Zuzenketak Matxin hobetzeko bildu dira, eta zuzendutako artikuluak Euskal Wikipedian argitaratu dira.
- Artikulu berriak wikitu dira, txantiloiak, barne-loturak, erreferentziak eta kategoriak zuzenduz.
Boluntarioaren lanaAldatu
Wikiproiektuan parte hartu duten boluntarioen lista behean dago. Horietako bakoitzaren lana hau izan da:
- OmegaT eta Matxin instalatu (Deskargatzeko eta erabiltzeko eskuliburua.pdf)
- Apur bat entrenatzeko, aukeratu artikulu labur bat praktikatzeko beheko listatik , eta landu OmegaT+Matxin tresnarekin:
- Jarri bere izena artikuluaren arduraduna eremuan,
- OmegaT aplikaziotik artikulua automatikoki itzuli Matxin erabiliz,
- Eskuz zuzendu, (Wikipediako formatuak ondo ezagutzen ez bazuen, begiratzen zuen txuleta edo tutorial luze hau)
- eta Wikipediara igo (OmegaT erabiliz ere egin daiteke).
- Aukeratu artikulu ertain edo luze bat ondoko listan, eta lehen bezala automatikoki itzuli, eskuz zuzendu, eta Wikipediara igo.
Proiektuan itzulitako Wikipediako artikuluak.

Proiektuan itzulitako hitzak.

AurkezpenakAldatu
Proiektu osoan egindako lanaren deskribapenaAldatu
- Wikipedia eta itzulpen automatikoa: 'Harri batez bizpalau xori' Ekaia aldizkaria, 2013
- (Ingelesez) Reciprocal Enrichment between Basque Wikipedia and Machine Translators. Liburu honetako kapitulu bat: 'The People’s Web Meets NLP: Collaboratively Constructed Language Resources', book edited by Iryna Gurevych and Jungi Kim, Springer, Book series 'Theory and Aplications of Natural Language Processing', E. Hovy, M. Johnson and G. Hirst (eds.). April 30, 2013 | ISBN-10: 3642350844 | ISBN-13: 978-3642350849.
2013eko Informatikari Euskaldunen Bilkuran (IEB2013)Aldatu
Edizio-maratoia Euskal Wikipediako 10. urteurreneanAldatu
2011eko Wikitzul eguna: Matxin eta Wikipedia hobetzenAldatu
2011eko Informatikari Euskaldunen Bilkuran (IEB2011)Aldatu
Azalpena bideoanAldatu
- Albisteak 2.0-ren 24. atalean proiektuaren inguruko laburpena dago ikusgai.
2010eko Wikimania kongresuanAldatu
- (Ingelesez) "Reciprocal Enrichment between Wikipedia and Machine Translators" laburpena"
- (Ingelesez) Aurkezpeneko diapositibak
- Iritzi-artikulua Gaur8n
OpenMT2 proiektuaren inguruko informazioaAldatu
- (Ingelesez) OpenMT2 proiektua
Proiektuak sortu dituen baliabideakAldatu
- 3GP, ALGOL, Aplikazio (informatika), Aplikazio bertikal, Aplikazio horizontal, Atzipen sekuentzial, Biltegiratze optiko, COM fitxategi, Common Object Request Broker Architecture, Datu-base eskema, Datu-konpresio, Deka, Delicious, Drupal, Egutegi elektroniko, Eliren liburua, ELIZA programa informatikoa, Emakumeak informatikan, Entitateen izenen ezagutzea, Erregistro, Etiketa (metadatua), Ezagutzaren metodologia, Funtzio boolear, Futbol Club Barcelona (eskubaloia), Gaseosa, Giga, Google itzultzailearen tresnen kutxa, Hans Weingartner, Hardware bidezko azelerazio, Helbide-bus, Hezkuntza-software, Hizkuntzaren ingeniaritza, Hot Potatoes, Ikaskuntzarako ingurune birtualak, Indexazio, Interfaze fisiko, Irudien prozesaketa digital, ISAPI, Itzulpen memoria, Jquery, Kaltura, Karga-efektu, Kilo, Kino (softwarea), Klon (informatika), Kode ireki, Kontsulta lengoaia, Kosinuaren transformatu diskretu, LAMP, League for Programming Freedom, Lego Mindstorms, Lengoaia informatiko, Lerrokatzaile, Lizentzia Publiko Komuna, Logika konputazional, Medikuntza software, Mega, Metalinguistika, Mikro, Murriztapen gramatika, Musikaren deskarga, Nano, Object Query Language, Oihaneko liburua (1967ko filma), Ordenadores Sin Fronteras (erakundea), Pantaila-babesle, Partizio editore, Pasabide (informatika), Peta (aurrizkia), Physics engine, Pico (aurrizkia), Pila (informatika), Programazio konkurrente, Programazio-lengoaien teoria, Red Hat, Renderizazio, Robotika, Runge-Kutta metodo, Sare lokal, Scratch (programazio-lengoaia), Seinale digital, Sistemen diseinua, Slax, Software fabrika, Software modelatzea, Software-errorea, Softwarearen metrika, Softwarezko sintetizadore, Spotify, Superordenagailu, Tera (aurrizkia), Testu-fitxategi, TortoiseSVN, Unity, USB memoria, Verbatim, Virtual Studio Technology, Von Neumannen arkitektura, XLiFF, Yotta, Zubi (informatika)
- Espainiera/euskara corpus paralelo bat. Mozilla softwarearen lokalizazioan sortu denaren bertsio berria. Eskerrak Elhuyarri eta Julen Ruiz-i.
- Testu itzuli eta zuzenduen corpus bat. Espainierazko Wikipediako 100 artikulu horiek Matxin itzultzailearekin sortutako itzulpenak dituena, gure kolaboratzaileek egin dituzten zuzenketekin, noski].
- wikigaiak4koa.pl perl-scripta. Wikipediako kategoria batean dauden artikuluen lista ematen duena. Artikulu bakoitzarekin beste datu batzuk ere ematen dira: ea beste hiru hizkuntzetako Wikipedietan dagoen eta zer luzera duen.
- OmegaT programaren bertsio hobetua, eta berau erabiltzeko eskuliburua.
- Matxin itzultzailearen bertsio berria, informatikako gaiak itzultzeko egokitu duguna (http://ixa2.si.ehu.es/matxin_zerb/translate.cgi). SOAP zerbitzu moduan definituta dago.
Parte-hartzaileakAldatu
Itzultzeko artikuluen zerrendaAldatu
Artikulu luzeakAldatu
Artikulu ertainakAldatu
Gaztelaniazko Wikipediako artikulua | Hitz-kopurua | Euskarazko Wikipediako artikulua | Hitz-kopurua | Itzulpenaren arduraduna |
3GP | 24.46 Kb | - | - | |
Acreditación_Europea_de_Manejo_de_Ordenador | 23.73 Kb | ez dago | - | - |
Acuerdo_de_nivel_de_servicio | 23.38 Kb | ez dago | - | - |
Administración_de_Memoria | 23.48 Kb | ez dago | - | - |
Advanced_Programmable_Interrupt_Controller | 24.54 Kb | ez dago | - | - |
ALGOL | 29.81 Kb | ALGOL | - | A. Diaz de Ilarraza |
Animación_por_computadora | 23.39 Kb | ez dago | - | joseba.makazaga |
Anomalía_de_Belady | 22.38 Kb | ez dago | - | - |
Archivo_de_texto | 22.66 Kb | ez dago | - | - |
ARJ | 22.46 Kb | ez dago | - | - |
Arquitectura_ARM | 19.57 Kb | ez dago | - | - |
Arte_ASCII | 22.70 Kb | ez dago | - | - |
ARts | 23.47 Kb | ez dago | - | - |
ASP.NET | 76.84 Kb | ez dago | - | - |
Auditoría_informática | 23.35 Kb | ez dago | - | - |
Avidemux | - | ez dago | - | - |
Bastard_Operator_from_Hell | 27.66 Kb | ez dago | - | - |
Beta_tester | 19.99 Kb | ez dago | - | - |
Biblioteca_de_enlace_dinámico | 28.20 Kb | ez dago | - | - |
Botnet | 30.69 Kb | ez dago | - | JesusIbañez |
Bus de direcciones | 304 | 205 | oarbelaitz | |
Bus_VESA | 21.05 Kb | ez dago | - | - |
Byte_(revista) | 22.67 Kb | ez dago | - | - |
CamelCase | 22.21 Kb | ez dago | - | - |
CD-ROM | 43.80 Kb | ez dago | - | - |
Chunk | 18.87 Kb | ez dago | - | - |
COBOL | 35.46 Kb | ez dago | - | - |
Código_Baudot | 22.78 Kb | ez dago | - | - |
Computación_paralela | 23.49 Kb | ez dago | - | JesusIbañez |
Controlador_de_Automatización_Programable | 21.99 Kb | ez dago | - | - |
CP/M | 32.00 Kb | ez dago | - | - |
Decimal_codificado_en_binario | 35.27 Kb | ez dago | - | - |
DDR2 | 31.79 Kb | ez dago | - | - |
Defense_Advanced_Research_Projects_Agency | 25.10 Kb | ez dago | - | - |
Delicious | - | Delicious | - | ksarasola |
Demoscene | 32.85 Kb | ez dago | - | - |
Desbordamiento | 20.00 Kb | ez dago | - | - |
Diccionario_morfológico | 23.35 Kb | ez dago | - | JesusIbañez |
Diseño_asistido_por_computadora | 23.60 Kb | ez dago | - | - |
Distancia_de_Levenshtein | 23.48 Kb | ez dago | - | - |
Dos_(desambiguación) | 23.26 Kb | ez dago | - | - |
DR-DOS | 24.90 Kb | ez dago | - | - |
DXF | 27.03 Kb | ez dago | - | - |
EBCDIC | 28.63 Kb | ez dago | - | - |
EDID | 23.86 Kb | ez dago | - | - |
Eiffel_(lenguaje_de_programación) | 23.82 Kb | ez dago | - | - |
El_Torito_(CD-ROM_Standard) | 90.26 Kb | ez dago | - | - |
Empaquetado_de_aplicaciones | 23.50 Kb | ez dago | - | - |
Enterprise_service_bus | 48.08 Kb | ez dago | - | - |
Especificación | 23.75 Kb | ez dago | - | - |
Fabricación_asistida_por_computadora | 23.91 Kb | ez dago | - | - |
Facultad_de_Informática_de_Barcelona | 24.02 Kb | ez dago | - | - |
Free_Lossless_Audio_Codec | 54.30 Kb | ez dago | - | - |
Garaje_HP | 23.30 Kb | ez dago | - | - |
GD-ROM | 24.70 Kb | ez dago | - | - |
Generador_de_números_aleatorios | 23.74 Kb | ez dago | - | - |
Género de videojuegos | - | ez dago | - | - |
Gobierno_electrónico | 23.18 Kb | ez dago | - | - |
Google Libros | - | ez dago | - | Inaki.a001 |
Google translator toolkit | 555 | Google itzultzailearen tresnen kutxa | 479 | Txibi72 |
GPX | 22.44 Kb | ez dago | - | - |
Graphical_Environment_Manager | 25.20 Kb | ez dago | - | - |
Gzip | 25.02 Kb | ez dago | - | - |
Hiperenlace | 25.02 Kb | ez dago | - | - |
HyperTransport | 33.35 Kb | ez dago | - | - |
IBM_PC_DOS | 22.74 Kb | ez dago | - | - |
Icaros | 18.13 Kb | ez dago | - | - |
Imagen_digital | 22.91 Kb | ez dago | - | - |
Imagen_generada_por_computadora | 23.56 Kb | ez dago | - | - |
IDE | 21.54 Kb | ez dago | - | - |
Imágenes_por_segundo | 23.13 Kb | ez dago | - | - |
Implementación | 23.75 Kb | ez dago | - | - |
Inclusión_digital | 23.14 Kb | ez dago | - | - |
Industria de los videojuegos | - | ez dago | - | - |
Industry_Standard_Architecture | 33.02 Kb | ez dago | - | - |
Information_Technology_Infrastructure_Library | 54.12 Kb | ez dago | - | - |
Ingeniería_asistida_por_computadora | 23.77 Kb | ez dago | - | - |
Infrared_Data_Association | 32.54 Kb | ez dago | - | - |
Ingeniería_informática | 23.39 Kb | ez dago | - | - |
Interfaz | 22.88 Kb | ez dago | - | A. Diaz de Ilarraza |
Interfaz_de_programación_de_aplicaciones | 34.34 Kb | ez dago | - | - |
Internacionalización_y_localización | 24.09 Kb | ez dago | - | - |
Interoperabilidad | 23.04 Kb | ez dago | - | - |
ISAPI | 19.03 Kb | ez dago | - | - |
Joint_Photographic_Experts_Group | 61.21 Kb | ez dago | - | - |
Juego_de_la_vida | 22.91 Kb | ez dago | - | - |
LabWindows/CVI | 25.20 Kb | ez dago | - | - |
Lamer_(informática) | 18.04 Kb | ez dago | - | - |
Lector_de_pantalla | 46.38 Kb | ez dago | - | - |
Leet_speak | 27.26 Kb | ez dago | - | - |
Ley de Acceso Electrónico de los Ciudadanos a los Servicios Públicos | 25.26 Kb | ez dago | - | - |
Licencia Pública Común | 446 | Lizentzia_Publiko_Komuna | 350 | Aingeru |
Logical_block_addressing | 26.36 Kb | ez dago | - | - |
Lookup_table | 41.55 Kb | ez dago | - | - |
Luser | 21.30 Kb | ez dago | - | - |
Magerit | 58.96 Kb | ez dago | - | - |
MagicGate | 23.75 Kb | ez dago | - | - |
Memex | 32.54 Kb | ez dago | - | - |
Memoria_de_traducción | 23.44 Kb | ez dago | - | - |
Memoria_flash | 23.01 Kb | ez dago | - | - |
Método_(informática) | 23.44 Kb | ez dago | - | - |
Metodologia_de_conocimiento | 23.43 Kb | Ezagutzaren metodologia | - | A. Diaz de Ilarraza |
Microsoft_Visual_Studio | 49.88 Kb | ez dago | - | - |
MISD | 21.45 Kb | ez dago | - | - |
Multiprocesamiento_simétrico | 23.44 Kb | ez dago | - | - |
Multiseat | 23.66 Kb | ez dago | - | - |
MXML | 18.55 Kb | ez dago | - | - |
Newbie | 25.35 Kb | ez dago | - | - |
NeXT | 61.56 Kb | ez dago | - | - |
Nibble | 37.11 Kb | ez dago | - | - |
Obtención_de_preferencias | 23.62 Kb | ez dago | - | - |
Oficina_de_servicios | 23.08 Kb | ez dago | - | - |
Operaciones_de_punto_flotante_por_segundo | 32.42 Kb | ez dago | - | - |
Pantalla_azul_de_la_muerte | 23.38 Kb | ez dago | - | - |
Paravirtualización | 23.22 Kb | ez dago | - | - |
PCI_Extensions_for_Instrumentation | 19.96 Kb | ez dago | - | - |
Planificación_de_sistemas_informáticos | 24.13 Kb | ez dago | - | - |
Plug_and_play | 26.84 Kb | ez dago | - | - |
Predictor_de_saltos | 23.08 Kb | ez dago | - | - |
problemas_aritméticos | 23.22 Kb | ez dago | - | - |
Problema_de_la_mochila | 23.30 Kb | ez dago | - | - |
Problema_de_la_galería_de_arte | 23.56 Kb | ez dago | - | - |
Proceso_zombie | 22.96 Kb | ez dago | - | - |
Producción textual colaborativa | - | ez dago | - | - |
Puerta de enlace | 473 | 306 | Utolotu | |
Química_computacional | 77.93 Kb | ez dago | - | - |
RAR | 26.46 Kb | ez dago | - | - |
RatDVD | 24.57 Kb | ez dago | - | - |
Red_de_área_metropolitana | 23.63 Kb | ez dago | - | - |
Registro_(base_de_datos) | 23.40 Kb | Erregistro | - | Ana Arruarte |
Renderización | 832 | 716 | joseba.makazaga | |
Runge-Kutta | 987 | 841 | joseba.makazaga | |
SAMPA | 24.88 Kb | ez dago | - | - |
SCADA | 57.87 Kb | ez dago | - | - |
SDL_(lenguaje_de_especificación) | 23.89 Kb | ez dago | - | - |
Secure_Hash_Algorithm | 29.34 Kb | ez dago | - | - |
SIMD | 22.56 Kb | ez dago | - | - |
Simulación_por_computadora | 23.42 Kb | ez dago | - | - |
Simulación | 32.77 Kb | ez dago | - | - |
Simulink | 22.76 Kb | ez dago | - | - |
Sincronización | 23.05 Kb | ez dago | - | - |
SISD | 21.11 Kb | ez dago | - | - |
Sistema_de_recomendación | 23.39 Kb | ez dago | - | - |
Sistema_digital | 26.49 Kb | ez dago | - | - |
Sistema_secuencial | 23.57 Kb | ez dago | - | - |
Slax | 950 | 652 | utolotu | |
Small_Computer_System_Interface | 34.27 Kb | ez dago | - | - |
Software educativo | - | - | Koru | |
Spotify | - | - | glabaka | |
SRAM | 39.72 Kb | ez dago | - | - |
Sun_SPARC | 45.18 Kb | ez dago | - | - |
SWF | 26.51 Kb | ez dago | - | - |
TANGO | 26.86 Kb | ez dago | - | - |
Tarjeta_perforada | 23.04 Kb | ez dago | - | - |
Tabla_de_Hash_Distribuido | 23.61 Kb | ez dago | - | - |
Transformada_de_coseno_discreta | 23.56 Kb | - | Jesus Aparizio | |
Transmisión_de_datos | 23.31 Kb | ez dago | - | - |
Trie | 27.12 Kb | ez dago | - | - |
UDF | 21.24 Kb | ez dago | - | - |
Unidad_Terminal_Remota | 23.26 Kb | ez dago | - | - |
Unity | 915 | 601 | Utolotu | |
User_Mode_Linux | 22.96 Kb | ez dago | - | - |
UTF-8 | 48.52 Kb | ez dago | - | - |
VINES | 22.74 Kb | ez dago | - | - |
WAMP | 21.52 Kb | ez dago | - | - |
Waveform_Audio_Format | 31.20 Kb | ez dago | - | - |
Windows_bitmap | 466 | ez dago | - | - |
Write_Once_Read_Many | 23.19 Kb | ez dago | - | - |
ZFS_(sistema_de_archivos) | 1748 | ZFS | 69 | - |
Guztira: 167 artikulu ertain | - | - | - | - |