Laguntza:Proba orria: berrikuspenen arteko aldeak
Ezabatutako edukia Gehitutako edukia
No edit summary |
No edit summary |
||
1. lerroa:
{{OpenMT-2}}
'''Weka''' (Waikato Environment for Knowledge Analysis - ''Ezagutzaren Azterketarako Waikato Ingurunea'') [[:en:University of Waikato|Waikatoko unibertsitatean]] garatuatako [[ikasketa automatikoa]] eta [[datuen meatzaritza]] egiten laguntzen duen Software-ingurune bat da. Weka GNU-GPL lizentziaren balditzapean banatzen den [[software libre]]a da.
== Historia laburra ==
* [[1993]]an, [[Zelanda berria|Zelanda berriko]] Waiko unibertsitateak Wekaren jatorrizko bertsioaren garapena hasi zuen (TCL/TK eta C programazio lengoaiak erabiliz).
* [[1997]]an, kodea Javan beridaztea erabaki zen modelatze algoritmoen inplementazioak kontuan hartuz.
* [[2005]]an, Wekak SIGKDD ("Special Interest Group on Knowledge Discovery and Data Mining") erakundearen "Data Mining and Knowledge Discovery Service" saria lortu zuen
* 2008ko maiatzaren 19an Sourceforgeko deskargen sailkapenean [http://sourceforge.net/top/topalltime.php?type=downloads ranking] '''248.''' postuan zegoen ( 1,186,740 deskargarekin).
== Deskribapena ==
Wekak paketeak bistaratze-tresnen eta [[:es:análisis de datos|datuen analisirako]] eta [[:en:Predictive modelling|modelatze prediktiborako]] algoritmoen bilduma bat du, funtzionalitate horietara erraz atzitzeko [[:es:interfaz gráfica de usuario| erabiltzailearen interfaze grafikoarekin]] batera. Wekaren jatorrizko bertsioa [[:es:Tcl|TCL/TK]] ''front-end'' bat izan zen, beste [[Programazio-lengoaia|programazio-lengoaia]] batzuetan inplementatutako algoritmoak modelatzeko, gehi ikasketa automatikoa egiteko [[C (programazio lengoaia)|C-z]] garatutatako datuen aurreprozesamendurako aplikazio batzuk. Jatorrizko bertsio hau hasiera batean [[Nekazaritza|nekazaritza]] domeinuko datuak analizatzeko diseinatu zen, baina Javan oinarritzen den bertsio berriena (WEKA 3), [[1997]]an garatzen hasi zena, area desberdina askotan eta oso area desberdinetan erabiltzen da, irakaskuntzan eta ikerketan bereziki.
=== Wekaren aldeko arrazoiak ===
Wekaren alde onak dira:
* [[GNU lizentzia publiko orokorra]]ren baldintzapean banatzen da.
* Oso portablea da [[Java programazio lengoaia| Javaz]] guztiz inplementatua dagoelako eta ia edozein plataforman exekutatu daiteke.
* Datuen aurreprozesamendurako eta modelatzerako tekniken bilduma zabal bat dauka.
* Hasiberri batentzat erabilterraza da duen [[Erabiltzailearen interfaze grafiko|Erabiltzailearen interfaze grafikoair]] esker.
Wekak [[datuen meatzaritza]]ren zenbait zeregin estandar onartzen ditu, batez ere, datuen aurreprozesaketa,clusteringa, [[sailkapena]], [[erregresioa]], bistaratzea, eta aukeraketa. Todas las técnicas de Weka se fundamentan en la asunción de que los datos están disponibles en un fichero plano (''[[:en:flat file|flat file]]'') o una relación, en la que cada registro de datos está descrito por un número fijo de atributos (normalmente numéricos o nominales, aunque también se soportan otros tipos). Wekak [[SQL]] bidezko [[datu-base]] atzipena eskaintzen du, [[JDBC]] ('' Java Database Connectivity'') konexioari esker. Eta datu-base batera egindako kontsulta baten emaitza prozesatu dezake. No puede realizar minería de datos multi-relacional, pero existen aplicaciones que pueden convertir una colección de tablas relacionadas de una base de datos en una única tabla que ya puede ser procesada con Weka.
=== Wekaren gabeziak===
Un área importante que actualmente no cubren los algoritmos incluidos en Weka es el modelado de secuencias<!-- sequence modeling -->.
== Erabiltzaile-interfazea==
[[Irudi:Weka_GUI_Chooser.png|right]]
Aplikazioa exekutatzerakoan '''Wekaren interfazearen hautagailua''' (''Weka Gui Chooser'') agertzen zaigu. Honek, programaren funtzionalitateak atzitzeko lau erabiltzaile-interfaze posibleren artean hautatzeko aukera ematen digu (''<u>Simple CLI</u>'', ''<u>Explorer</u>'', ''<u>Experimenter</u>'' eta "<u>Knowledge Flow</u>'').
=== Simple CLI ===
'''Simple CLI''' es la abreviatura de ''Simple Command-Line Interface'' (Interfaz Simple de Línea de Comandos); se trata de una consola que permite acceder a todas las opciones de Weka desde [[línea de comandos]].
=== Explorer ===
La interfaz '''Explorer''' (Explorador) dispone de varios paneles que dan acceso a los componentes principales del banco de trabajo:
:* El panel "<u>''Preprocess''</u>" dispone de opciones para importar datos de una [[base de datos]], de un [[Archivo (Computación)|fichero]] [[CSV]], etc., y para preprocesar estos datos utilizando los denominados algoritmos de ''filtrado''. Estos filtros se pueden utilizar para transformar los datos (por ejemplo convirtiendo datos numéricos en valores discretos) y para eliminar registros o atributos según ciertos criterios previamente especificados.
:* El panel "<u>''Classify''</u>" permite al usuario aplicar algoritmos de [[clasificación]] estadística y análisis de [[regresión]] (denominados todos ''clasificadores'' en Weka) a los conjuntos de datos resultantes, para estimar la [[Precisión y exactitud|exactitud]] del [[:en:Predictive modelling|modelo predictivo]] resultante, y para visualizar predicciones erróneas, [[:en:receiver operating characteristic|curvas ROC]], etc., o el propio modelo (si este es susceptible de ser visualizado, como por ejemplo un [[árbol de decisión]]).
:* El panel "<u>''Associate''</u>" proporciona acceso a las [[reglas de asociación]] aprendidas que intentan identificar todas las interrelaciones importantes entre los atributos de los datos
:{{AP|Weka-Associate|'''Weka-Associate'''}}
:* El panel "<u>''Cluster''</u>" da acceso a las técnicas de ''clustering'' o [[Algoritmo de agrupamiento|agrupamiento]] de Weka como por ejemplo el algoritmo [[:en:K-means algorithm|K-means]]. Este es sólo una implementación del [[algoritmo expectación-maximización]] para aprender una mezcla de [[distribución normal|distribuciones normales]].
:* El panel "<u>''Selected attributes''</u>" proporciona algoritmos para identificar los atributos más predictivos en un conjunto de datos.
:* El panel "<u>''Visualize''</u>" muestra una matriz de puntos dispersos (''[[:en:Scatterplot|Scatterplot]]'') donde cada punto individual puede seleccionarse y agrandarse para ser analizados en detalle usando varios operadores de selección.
===Experimenter===
La interfaz '''Experimenter''' (Experimentador) permite la comparación sistemática de una ejecución de los algoritmos predictivos de Weka sobre una colección de conjuntos de datos.
===Knowledge Flow===
'''Knowledge Flow''' (Flujo de Conocimiento) es una interfaz que soporta esencialmente las mismas funciones que el ''Explorer'' pero con una interfaz que permite "''[[Drag and drop|arrastrar y soltar]]''". Una ventaja es que ofrece soporte para el aprendizaje incremental.
== Erreferentziak ==
{{erreferentzia zerrenda}}
== Ikusi, gainera ==
* [[Datu-meatzaritza]]
* [[:en:List of numerical analysis software| Zenbakizko analisiarrako Software zerrenda]]
==Kanpo loturak==
=== Orokorrak ===
* [http://www.cs.waikato.ac.nz/ml/weka/ Página oficial de Weka] en la [[Universidad de Waikato]], [[Nueva Zelanda]]
* [http://sourceforge.net/projects/weka/ Página del proyecto Weka en SourceForge] ([http://www.pentaho.org/news/releases/20060919_pentaho_acquires_weka.php acquired] by Pentaho in September 2006)
* [http://weka.sourceforge.net/wiki/ WekaDoc] Wiki de documentación de Weka
* [http://www.dsic.upv.es/~cferri/weka/ Página sobre Weka de Cèsar Ferri] ([[Universidad Politécnica de Valencia|UPV]] - [[España]])
* [http://metaemotion.com/diego.garcia.morate/download/weka.pdf Una introducción a Weka] (en '''español''')
* [http://www.stratebi.es/todobi/ago10/Algoritmos-Herramientas_Data_Mining.pdf Comparativa de algoritmos de DM implementados] - [http://todobi.blogspot.com/2010/08/comparativa-de-algortimos-de.html Vía TodoBI]
===Aplikazioen adibideak===
* [http://cogprints.org/4399/ Acronym identification]
* [http://dx.doi.org/10.1016/j.compbiolchem.2004.11.001 Gene selection from microarray data for cancer classification]
* [[:en:QSPR|QSPR]] [http://dx.doi.org/10.1021/ci0504216 of metal complexation]
* [http://mips.gsf.de/proj/est3 Classification] of [[Expressed sequence tag]] (EST) data from plant/pathogen interface
* [http://weka.sourceforge.net/wiki/index.php/Related_Projects Further related projects and applications]
===Bertsio hedatuak===
* [http://grid.deis.unical.it/weka4ws Weka4WS: a Grid-enabled version of Weka developed at University of Calabria, Italy]
[[de:Waikato Environment for Knowledge Analysis]]
[[en:Weka (machine learning)]]
[[fr:Weka (apprentissage automatique)]]
[[it:Weka]]
[[nl:Weka (software)]]
[[pt:Weka]]
[[ru:Weka]]
|