Datu handiak: berrikuspenen arteko aldeak

Ezabatutako edukia Gehitutako edukia
t Theklan wikilariak «Lankide:Eaginako/Proba orria» orria «Big Data» izenera aldatu du
No edit summary
Etiketa: 2017 wikitestu editorearekin
1. lerroa:
{{Itzulia|es|hizkuntza=gaztelaniazko|Macrodatos}}
'''Datu handiak''' edo '''datu masiboak''' ({{lang-en|Big data}}) prozesatzeko oso multzo handia osatzen duten [[datu]]ak dira, konplexutasun handikoak; ohiko [[informatika]]-sistementzat zaila izaten da horrelako datuak prozesatzea.<ref>[[Euskalterm]]en definizioa, 2015</ref> Bere [[datuen analisi|analisi]], tratamendu, eskuratze, partekatze eta babeste erronka handiak dira. Gehienetan, [[iragarpen analitiko]]ak egiteko erabiltzen dituzte<ref>{{erreferentzia|url= http://link.springer.com/10.1007/978-3-319-21569-3 |izenburua= New Horizons for a Data-Driven Economy |argitaletxea= Springer|doi= 10.1007/978-3-319-21569-3}}</ref> [[Internet]]eko bilakaeran, finantzetan, [[meteorologia]]n, [[genetika]]n<ref>{{erreferentzia |izenburua= Community cleverness required |aldizkaria= [[Nature]] |liburukia= 455 |alea= 7209 |orrialdea= 1 |data= 2008-9-4 |doi= 10.1038/455001a |url= http://www.nature.com/nature/journal/v455/n7209/full/455001a.html}}</ref> eta beste hainbat arlotan.
'''Big data''' edo '''Datu handiak''' terminoak datu kantitate handi bati egiten dio erreferentzia, zeinak software konbentzionalaren ahalmena gailentzen duen datu horiek guztiak zentzuko denboran harrapatu, kudeatu eta prozesatzeko. Datu masiboen bolumena etengabe hazten da. Termino hau 1990. hamarkadatik aurrera erabili da eta, batzuek, John Mashey zientzilariari<ref>http://static.usenix.org/event/usenix99/invited_talks/mashey.pdf</ref> eman diote hedatzearen ospea. 2012an bere tamaina hamabi [[terabyte]] eta hainbat [[petabyte]] artekoa zela balioztatu zen datu multzo bakar batean. [[MIKE2.0]] metodologiak definizio hau ematen du Datu handientzat: "[[informazioaren kudeaketa]]<nowiki/>rekin erlazionaturiko gaiak ikertzen ditu, permutazio erabilgarrien, konplexutasunen eta erregistro indibidualak ezabatzeko zailtasunen terminoetan".<ref>[http://mike2.openmethodology.org/wiki/Big_Data_Definition Big Data Definition]</ref>
 
'''Big1980ko data'''hamarkadatik edoaurrera, '''Datu40 handiak'''hilabetero terminoakmunduan datuinformazioa kantitatepilatzeko handigaitasuna batibikoiztu egiten dioegin da;<ref>{{erreferentzia | abizena1 = Hilbert | izena1 = Martin | izena2 = Priscila |abizena2=López | izenburua = The World's Technological Capacity to Store, zeinakCommunicate, softwareand konbentzionalarenCompute ahalmenaInformation gailentzen| duenaldizkaria datu= horiek[[Science]] guztiak| zentzukoliburukia denboran= harrapatu332 | alea = 6025 | orrialdea = 60–65 | urtea = 2011 | doi = 10.1126/science.1200970 | pmid = 21310967 | url= http://martinhilbert.net/WorldInfoCapacity.html}}</ref> 2012. urtean, kudeatuegunero eta2,5 prozesatzeko[[exabyte]] (2,5×10<sup>18</sup>) datu sortzen zen.<ref>{{erreferentzia|url= http://www.ibm.com/big-data/us/en/ |izenburua= IBM What is big data? – Bringing big data to the enterprise |egilea= [[IBM]]}}</ref> Datu masiboen bolumena etengabe hazten da. Termino hau 1990. hamarkadatik aurrera erabili da eta, batzuek, John Mashey zientzilariari<ref>http://static.usenix.org/event/usenix99/invited_talks/mashey.pdf</ref> eman diote hedatzearen ospea. 2012an bere tamaina hamabi [[terabyte]] eta hainbat [[petabyte]] artekoa zela balioztatu zen datu multzo bakar batean. [[MIKE2.0]] metodologiak definizio hau ematen du Datu handientzat: "[[informazioaren kudeaketa]]<nowiki/>rekin erlazionaturiko gaiak ikertzen ditu, permutazio erabilgarrien, konplexutasunen eta erregistro indibidualak ezabatzeko zailtasunen terminoetan".<ref>[http://mike2.openmethodology.org/wiki/Big_Data_Definition Big Data Definition]</ref>
 
2001ean, kongresu eta erlazionatutako aurkezpenetan oinarritzen zen ikerketa txosten batean<ref>https://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-Data-Management-Controlling-Data-Volume-Velocity-and-Variety.pdf</ref>, META Group (orain Gartner) enpresak datuen hazkuntza konstantea bolumena, abiadura eta aniztasuna ikertzeko aukera eta erronka bezala definitzen zuen<ref>{{Erreferentzia|izenburua=Gartner Says Solving 'Big Data' Challenge Involves More Than Just Managing Volumes of Data|hizkuntza=en|url=https://www.gartner.com/newsroom/id/1731916|sartze-data=2018-11-27}}</ref>. Gartner enpresak datu masiboak erreferentzia bezala erabiltzen jarraitzen du. Gainera, datu masiboen merkatuko hornitzaile handiek datu kantitate horien prozesatzeari buruzko eskaera kritikoenei erantzuteko irtenbideak garatzen dituzte, hala nola, MapR eta Cloudera.
 
2016ko definizio batek terminoa horrela definitzen du: “Datu handiek balioan eraldatzeko teknologia espezifiko eta metodo analitikoak beharrezkoak dituen bolumen, abiadura eta aniztasun handiagatik bereizitako informazio aktiboa adierazten dute”<ref>{{Erreferentzia|izena=Andrea|abizena=De Mauro|izenburua=A formal definition of Big Data based on its essential features|orrialdeak=122–135|hizkuntza=en|abizena2=Greco|abizena3=Grimaldi|izena2=Marco|izena3=Michele|data=2016-04-04|url=https://www.emeraldinsight.com/doi/full/10.1108/LR-06-2015-0061|aldizkaria=Library Review|alea=3|zenbakia=65|issn=0024-2535|doi=10.1108/lr-06-2015-0061|sartze-data=2018-11-27}}</ref>. Gainera, erakunde batzuek beste V bat gehitzen dute, alegia, deskribatzeko egiazkotasuna<ref>{{Erreferentzia|izenburua=https://www.villanovau.com/resources/bi/what-is-big-data/#.W_1MGWj0nIV|url=https://www.villanovau.com/resources/bi/what-is-big-data/#.W_1MGWj0nIV|aldizkaria=www.villanovau.com|sartze-data=2018-11-27}}</ref> (gaztelaniaz ''Veracidad para describir''), industriaren autoritate batzuek zalantzan jartzen duten errebisionismoa dena<ref>{{Erreferentzia|izenburua=Big Data: Avoid 'Wanna V' Confusion - InformationWeek|hizkuntza=en|url=https://www.informationweek.com/big-data/big-data-analytics/big-data-avoid-wanna-v-confusion/d/d-id/1111077|aldizkaria=InformationWeek|sartze-data=2018-11-27}}</ref>. Hiru Vak, bolumena, abiadura eta aniztasuna (gaztelaniaz ''Volumen, Velocidad y Variabilidad'') Datu handien beste ezaugarri osagarrietara hedatu dira:
 
== Hiru Vak ==
*[[Ikasketa automatiko|Ikasketa automatikoa]]: Datu handiek sarritan ez dute ''zergatik'' galdetzen eta ereduak soilik antzematen dituzte<ref>{{Erreferentzia|izena=Viktor|abizena=Mayer-Schönberger|izenburua=Big Data: A Revolution That Will Transform How We Live, Work, and Think|argitaletxea=Houghton Mifflin Harcourt|hizkuntza=en|abizena2=Cukier|izena2=Kenneth|data=2013-03-05|url=https://books.google.com.ar/books?id=HpHcGAkFEjkC&hl=es|isbn=0544002938|sartze-data=2018-11-27}}</ref>
Hiru Vak, bolumena, abiadura eta aniztasuna (gaztelaniaz ''Volumen, Velocidad y Variabilidad'') Datu handien beste ezaugarri osagarrietara hedatu dira:
 
*[[Ikasketa automatiko|Ikasketa automatikoa]]: Datu handiek sarritan ez dute ''zergatik'' galdetzen eta ereduak soilik antzematen dituzte<ref>{{Erreferentzia|izena=Viktor|abizena=Mayer-Schönberger|izenburua=Big Data: A Revolution That Will Transform How We Live, Work, and Think|argitaletxea=Houghton Mifflin Harcourt|hizkuntza=en|abizena2=Cukier|izena2=Kenneth|data=2013-03-05|url=https://books.google.com.ar/books?id=HpHcGAkFEjkC&hl=es|isbn=0544002938|sartze-data=2018-11-27}}</ref>
* [[Aztarna digitala]]: Datu handiak sarri interakzio digitalaren kosturik gabeko azpiproduktu bat dira.