Ireki menu nagusia

Aldaketak

710 bytes added ,  Duela 4 urte
t
Robota: Birzuzenketak konpontzen
[[Fitxategi:Loess curve.svg|thumb|right|300px|'''Estatistikak''' [[datu (argipena)|datuetan]]etan dauden joerak eta erregulartasunak bilatu eta zehaztu egiten ditu, natura eta giza fenomenoak argitze aldera. Irudian, errealitatetik jasotako datu-multzo bati estatistika-teknika batez egokitutako lerroa.]]
 
'''Estatistika''' fenomeno aldakor eta ziurgabeei buruzko [[datu-multzo]]ak bildu, sailkatu, irudikatu, laburtu eta aztertu egiten dituen metodo eta prozeduren multzoa da, horien baitan dauden erregulartasunak eta erlazioak hauteman, horietarako [[eredu (argipena)|ereduak]]ak eratu, aurresanak egin, konklusio zehatzak eman eta erabaki egokiak hartzearren. Labur, estatistikaren helburua jasotako datuetatik informazio baliagarria eskuratzeko teknikak garatu eta aplikatzea da. Horretarako, [[matematika]], [[probabilitate teoria]] eta [[erabaki-teoria]] oinarritzat hartzen ditu. Estatistikaren teknikak maila bitan erabiltzen dira: [[estatistika deskribatzaileadeskribatzaile]]nan teknika sinple eta errazak erabiltzen dira datuak irudikatu eta laburtzeko; [[inferentzia estatistiko]]ak, berriz, azterketa konplexuago eta zorrotzagoa egiten du, datuak eredu matematiko batera egokitu eta berarekin duten [[errore estatistiko]]a neurtuz, [[probabilitate]] kontzeptuan oinarrituz horretarako. Egun funtsezko metodologia da ikerketa zientifikoan eta alor guztietan zabaltzen da bere erabilera, hala nola [[ekonomia]]n, [[medikuntza]]n, [[soziologia]]n eta [[meteorologia]]n. Hala ere, erabilera oker batengatik estatistika manipulazio eta erroreen iturburua izan da sarri; hori dela eta, estatistikaren emaitzak behar bezala interpretatzeko garrantzitsutzat jotzen dira estatistikaren [[zientzia-dibulgazio|jendarteratzea]] eta estatistika-hezkuntza zorrotza, estatistika teknikak eta horietarako programa informatikoen aukerak tentuz baliatzeko.
 
Beste alde batetik, ''estatistikak'' terminoa edonolako datu multzoak, baina gehienetan erakunde publikoek argitaratutako datu ofizialak, adierazteko ere erabili ohi da (langabetuen estatistikak eta osasun estatistikak, esaterako). Estatistika ez da, ordea, datuak jasotzera mugatzen, harago doa eta datuen azterketarako metodologia ere hartzen du bere baitan.
== Historia ==
{{sakontzeko|Estatistikaren historia}}
XVII. eta XVIII. mendeetan estatistika terminoa sortu eta oinarrizko metodologia zientifiko bilakatu aurretik, anitzetan burutzen ziren datu bilketak. [[Antzinako Egipto]]n eta beste zibilizazio zaharretan ohizkoak ziren zentsuak. [[Erdi Aroa]]n ere ezagunak dira egindako datu bilketa batzuk, Ingalaterran egindako [[Domesday Book]] delakoa esaterako. Estatistika datuen azterketa moduan ikusi zuen lehenengo bidegilea [[John Graunt]] ingelesa izan zen XVII. mendean; Londresko datu [[demografikodemografia|demografikoak]]ak erabiliz, aurresanak eta beste ondorioak ateratzen ditu datuetatik. Demografiari buruzko ikerketak eta estatuei buruzko datu ekonomiko eta politikoen bilketa eta azterketa ugaldu ziren XVIII. mendean, Alemanian sortu berria zen "''statistik''" arloaren, datu-bilketa hutsa zena, eta, datuak biltzeaz gainera, horiek aztertu ere egiten zituen ''aritmetika politikoa'' delakoaren baitan, [[William Petty]] ingeles zientza gizonak garatu zuena. XVIII. mendean probabilitate teoria garatu zen eta horrela XIX. mendearen hasierarako estatistika probabilitate teoriarekin uztartzeko teoria osaturik zegoen, [[Pierre-Simon Laplace]] zientzia gizonari esker, besteak beste, [[banaketa normal]]ean eta beste kontzeptu batzuetan oinarrituz. XIX. mendea aplikazioak zientzia anitzetara hedatu ziren. [[Adolphe Quételet]] izan zen mende horretan estatistikaren erabileraren zabalkuntza bultzatzen dutenetako bat. XX. mendean, [[Ronald Fisher]] estatistikariak [[inferentzia estatistiko]]aren teoria garatu eta [[Andrei Kolmogorov]] sobietar matematikoak [[probabilitate]]aren axiomatika eratu zuen. [[Bayestar estatistika]] izeneko adarra ere mendean zehar garatutako [[erabaki-teoria]]n oinarritzen da. Hainbat [[aldagai (argipena)|aldagai]] batera aztertzen duen [[aldagai anitzeko analisi]]ko teknikak ere garatzen dira. Horiei guztiei eske, estatistikaren eraikin kontzeptuala osatu eta teknika eta eredu berrietarako oinarria finkaturik geratzen da XX. mendeko erdialderako. Hala ere, [[informatika]]ren garapenak aukera berriak zabaltzen ditu datu-multzo itzelak jaso eta aztertzeko, aldagai anitzeko analisiaren aplikazio masiborako bidea zabalduz eta [[datu-meatzaritza]] izeneko teknikak baliatuz.
 
== Estatistika zientzian ==
 
Errealitatea ezagutzeko eta zientziaren garapenerako [[enpirismo]] eta [[positibismo]] korronte [[epistemologikoepistemologia|epistemologikoak]]ak dira estatistika tresna zientifiko moduan balioesten dutenak. Korronte horien arabera ezaguera zentzumenezko esperientzian oinarritu behar da eta esperientzia horren analisia da, [[logika induktibo]] batean oinarritua, errealitatearen fenomenoak ulertzen ahalbidetzen duena. Logika induktiboan gertaeren errepikapenak ezaguera sendoak eratzeko balio du, maiz azaldu den gertaera batek etorkizunean ere gertatzeko aukera handiak baititu, kondizio berdinak gauzatzen badira; hain zuzen ere, estatistikaren oinarria gertaeren [[maiztasun (estatistika)|maiztasun]] eta [[probabilitate]]etan datza, eta horrela, logika induktibozko teknika moduan, hartzen du metodo zientifikoaren funtsezko osagaia izateko zilegitasuna.
 
Estatistikari egin zaizkion kritikak [[gizarte zientzia-zientziak|gizarte zientzietan]] egiten den erabilerarekin daude loturik. Zehatzago, giza eta gizarte fenomenoak zenbakiz eta estatistikaz aztertzen direnean, modu murriztaile batez jokatzen dela argudiatu izan da, fenomenoa isolatuz eta neurtuz. Beste aldetik, ordea, giza eta gizarte fenomenoak modu teorikoan soilik aztertzeak ikerketari zientifikotasuna kentzen diola aipatzen da. Horrela, estatistikaren erabilerak ekar dezakeen alborapena saihesteko, jasotzen diren datuen ingurua eta eremua kontuan hartzea, salbuespenak baztertuz banakoak biltzen dituen agregatuak edo multzoak aztertzea eta ikertzaileak berak fenomenoan nahiz datuak jaso eta interpretatzean izan dezakeen eragina eta joera deuseztea proposatu dira azterketa estatistiko zuzen baterako ildo nagusi moduan.
 
== Estatistikaren metodologia ==
 
[[Fitxategi:Bundesarchiv Bild 183-C1228-0015-001, Berlin, Volkszählung.jpg|thumb|right|250px|Estatistikan, [[datu (argipena)|datuak]]ak jasotzeko ohiko metodo bat [[inkesta]] da ''(irudian)''. Jasotako datuak populazio osoaren adierazgarri izan daitezen, inkestarako aukeratzen diren pertsonak, [[lagin (estatistika)|lagina]] osatzen dutenak hain zuzen, [[zori]]z aukeratu behar dira.]]
Estatistika ikerketa bat [[populazio (estatistika)|populazio]] bat eta bertan jasoko diren [[aldagai (argipena)|aldagaiak]]ak zehatz definituz abiatzen da, ikergai den eremua zehaztuko dutena. Erabili beharreko estatistika teknikak zehazterakoan, aldagaiak [[aldagai kuantitatibo|kuantitatiboak]] edo [[aldagai kualitatibo|kualitatiboak]] diren hartu behar da kontuan. Populazio horren gainean datuak jasotzerakoan bi prozedura izaten dira aukeran: [[zentsu (estatistika)|zentsua]], non populazioko elementu guztien datuak biltzen diren; eta [[laginketa]], non populazioko elementu batzuk soilik jasotzen diren, [[lagin (estatistika)|lagin]] bat osatzeko. Datuek populazio bateko lagina osatzen dutenean, lagina populazioaren adierazgarria izan dadila saiatu behar da; horretarako lagina osatzen duten elementuak [[zori]]z aukeratu behar dira, ikerketan izan daitezkeen alborapenak baztertuz. Datuak [[saiakuntza]]z nahiz behaketaz ([[inkesta]] bat burutuz, adibidez) jaso daitezke. Saiakuntzaren kasuan, aldagaiak eta [[behaketa-errore|errore esperimentalesperimentala]]a kontrolatzeko teknika estatistiko bereziak daude; behaketazko ikerketetan, berriz, inkesta eta datu-bilketa zorrotz diseinatu eta planifikatu behar dira, datu bilketak zenbatespen estatistikoetan [[alborapen (estatistika)|alborapenik]] ez sorrarazteko. Adibidez, etxez etxeko inkestak egiten badira etxe bakoitzean bizi den pertsona kopuruaz galdezka, pertsona asko bizi diren etxeetan atea zabaltzeko probabilitatea handiagoa da eta txikiagoa pertsona bakarra bizi den etxeetan; erantzunik jaso ez den etxeak baztertzen badira, etxeko pertsona kopurua gehiegiz zenbatesteko joera izango da.
 
Nolanahi ere, datu bilketa [[zeharkako datu]]ak (une jakin batean multzo bateko elementuen gainean datuak jasotzen direnean) nahiz [[luzetarako datudatuak]]ak (elementu berdinen gainean, datuak denboran zehar jasotzen direnean) osatuz egin daiteke; sailkapen horrek ere teknika estatistiko bereiziak ekartzen ditu. Beste irizpide baten arabera, azterketa estatistiko baterako hartzen diren datuak lehen mailakoak (estatistikaren erabiltzaileak berariaz jaso dituenak) nahiz bigarren mailakoak (beste ikerketa batean jasotakoak) izan daitezke: lehen mailako datuak ikertzaileak zehazturiko helburuei jarraiki jasotzen diren bitartean, bigarren mailako datuetara eta horiek jasotzeko erabili den metodologiara moldatu beharra dago, estatistikaren erabiltzailearen zeregina kondizionatuz horrela<ref>{{en}} {{Erreferentzia
|izena=Gene V.
|abizena=Glass
|url=http://www.jstor.org/pss/1174772}}.</ref>.
 
Datuak bildu ondoren, horiek [[maiztasun-banaketa|maiztasun-taula]] batean azaldu nahiz modu grafikoan irudikatu behar dira, datuak modu ulergarri batez plazaratu nahiz ondorengo azterketa zorrotz baterako esplorazio-tresna moduan. Horrekin batera eta helburu berdinez, ohikoa da datuak laburbiltzeko neurri, koefiziente eta teknika estatistiko sinpleak erabiltzea.
 
Datuak plazaratu eta azterketa sinple bat egiteaz haraindi, azterketa zorrotza burutu nahi bada, jasotako aldagaien arteko erlazio konplexuak bilatuz edota datuak probabilitatezko [[eredu (argipena)|eredu]] batera egokituz, teknika estatistiko eta matematiko konplexuagoak baliatu beharko dira, [[aldagai anitzeko analisi]]aren edo [[inferentzia estatistiko]]aren baitan. Sarri, datuei egokitu beharreko eredua zehaztea da helburua, [[parametro (estatistika)|parametroak]] zenbatetsiz edo balio jakin zenbaitetarako kontrastatuz, ereduaren propietate eta ondorioak datuek islatzen duten fenomenora zabaltzeko. Teknika horiek aplikatzerakoan, maiz ezartzen dira datuei buruzko aldez aurretiko suposizio eta hipotesiak, hala nola datuak zoriz jaso direla eta [[populazio (estatistika)|populazio]] homogeneo batetik eratorritakoak direla; erabilitako tekniken bitartez eskuratutako emaitzak balioztatzeko, baldintza haiek ere egiaztatu egin behar dira.
 
Nolanahi ere, datu multzo baten azterketa estatistikorako teknika anitz izaten da aukeran eta zaila izaten da erabakitzea zein den egokiena. Beti hartu behar da kontuan prozedura estatistiko asko lortu behar diren aplikagarritasuna baldintzatzen duten emaitzen froga matematikoetan oinarritzen direla; froga matematiko horietako pausoak ezagutu gabe, azkenean emaitzak eskuratuko dira, baina ez dira fidagarriak izango. Azkenik, emaitza estatistikoak heldu nahi den hipotesi edo helburu zientifikoaren ikuspuntutik baloratu behar da eta ez emaitza soil moduan.
=== Estatistika deskribatzailea, probabilitate-teoria eta inferentzia estatistikoa ===
 
Estatistikaren eraketa teorikoa hiru hiru mailatan zatitu ohi da: [[estatistika deskribatzaile]]a, [[probabilitate teoria|probabilitate-teoria]] eta [[inferentzia estatistiko]]a. Zatiketa hori izaten da, gainera, estatistikaren irakaskuntzan modu ordenatuan jarraitzen dena, estatistika deskribatzailea estatistikaren sarrera moduan baliatuz. Probabilitate-teoria eta inferentzia estatistikoaren teknikak garatu eta horien baliozkotasuna frogatzeko matematika erabiltzen da. Hori dela eta, arlo horietako oinarri, kontzeptu eta teoremen multzoari [[estatistika matematiko]] deitu izan zaio.
 
Estatistika deskribatzaileak datuen deskribapen hutsa egiten du, teknika sinpleak erabiliz, datuak irudikatu eta laburtzeko. Aplikazio askotan ez da beharrezkoa zehaztasun handia eta datuen ezaugarri nagusienak lortu eta sinpletasunez erakusteko nahikoa izaten da. [[Datu -diagrama|Datu diagramak]]k, [[maiztasun-banaketa]]k, [[batezbesteko]]en eta [[bariantza]]ren kalkulua (banaketen zentroa eta [[sakabanatze neurri(estatistika)|sakabanatzea]] neurtzeko, hurrenik hurren) eta bestelako [[estatistiko]] edo neurriak biltzen ditu estatistika deskribatzaileak. Aldagaien arteko erlazioak ere modu deskribatzaile batez azter daitezke, diagramak baliatuz nahiz [[korrelazio]]-koefizienteak kalkulatuz.
 
 
Estatistikak tresna sinpleak ere eskaintzen ditu datuak aztertzeko: batzuetan nahikoak dira datuen-taularaketa eta batezbestekoaren kalkulua datuak laburbiltzeko.
 
''Adibidez, ikasgela bateko 25 haurren matematika-kalifikazioak jaso dira: 6-7-8-7-6-5-5-6-5-9-7-8-9-7-8-7-8-7-8-7-7-6-6-8-7; datuak [[maiztasun-banaketa|maiztasun-taula]] batean bilduz gehien agertzen den kalifikazioa 7 dela ikus daiteke; [[barra -diagrama|barra diagraman]]n ere ikus daitekeenez. [[Batezbesteko aritmetiko sinple]]aren emaitzak ere notak 6.96 balioaren inguruan biltzen direla erakusten du.''
 
 
</div>
 
[[Fitxategi:Fisher iris versicolor sepalwidth.svg|thumb|right|200px|Estatistikaren ohiko metodologia da datuetara egokitzen diren [[eredu (argipena)|ereduak]]ak eratzea (irudian, [[histograma]] batez irudikatutako [[banaketa normal]]a.]]
 
Deskribapenaz haraindi doa estatistika: datuen aldakortasunaren iturburua zorizkotasuna denez, [[probabilitate- teoria|probabilitate-teoriak]]k datuak eta populazioak [[matematika]] eta [[probabilitate]] kontzeptua erabiliz islatzen dituzten ereduak zehazten ditu. Eredu hauek zehaztu gabeko [[parametro (estatistika)|parametroak]] izaten dituzte, datuak aztertuz kuantifikatuko direnak. Probabilitate-teoriak eredu hauen propietateak, ondorioak eta beraien arteko erlazioak ere aztertzen ditu. Probabilitatearen eta datuen arteko lotura [[maiztasun (estatistika)|maiztasuna]] da: adibidez, ikasgela batean maila bat gainditu dutenak %70 badira, maila gainditzeko probabilitatea 0.7 dela zenbatesten da.
 
Horrela, [[inferentzia estatistiko]]aren xedea datuak aukeratutako probabilitate-eredura doitzea da. Horretarako, ereduaren [[parametro (estatistika)|parametroak]] zenbatetsi egin behar dira datuek osatzen duten [[lagin (estatistika)|laginean]] oinarrituz. Adibidez, 15 urteko mutilen altuerak eta pisuak, kartesiar diagrama batean jarrita, ez dira guztiz egokitzen zuzen batera, baina zuzena eredu onargarria eta erosoa izan daiteke datu multzoa deskribatu eta sakonago aztertzeko; [[zuzen (geometria)|zuzenaren ekuazioekuazioa]]a, zuzenaren parametroak alegia, datuetan oinarrituz zenbatetsi behar dira. Parametroen zenbatespenek errorerik badute, noski, datuen zorizkotasunak eta populazio batetik eratorritako lagina izateak eragindakoa. Errorearen neurria izateko, [[konfiantza-tarte]]ak erabiltzen dira. Parametro ezezagunak kuantifikatzeko beste modu bat horien balioa finkatu eta datuak balio horrekin bat datozen aztertzea da, [[hipotesi-froga|hipotesi-kontraste]] baten bitartez. Parametroetan zentraturiko estatistikaren aukera moduan, [[estatistika ez-parametriko|estatistika ez parametriko]] izeneko arloa dago, datuei eredurik egotzi gabe, populazioen ezaugarriei buruzko hipotesiak egiaztatzen dituena.
 
Ikerketa zientifikoetan inferentzia estatistikoak eskaintzen dituen teknikak erabiltzen dira egun, zehatzagoak eta zorrotzagoak baitira, eta estatistika deskribatzailea datuak esploratu, zein eredu mota izan daitekeen egokiena erabakitzeko, edota publikora zabaltzeko soilik erabiltzen da. Esplorazio-helburua nabarmenduz, [[datuen azterketa esploratzaile]] izeneko teknika multzoa garatu zen XX. mendearen mendean, ereduen zurruntasuna kritikatu eta bereziki tresna grafikoak proposatzen dituena, ereduetan [[muturreko datu]]ek duten eragina nabarmenduz eta horiek hautemateko prozedurak ezarriz.
=== Korrelazio eta erregresio teknikak ===
 
[[Fitxategi:Linear least squares.svg|thumb|right|200px|Kartesiar diagraman irudikatzen diren bi aldagaiek (datuak gorriz adierazten dira) [[korrelazio]] positiboa dute: batak gora egitean, besteak ere gora egiten du. Urdinez datuetara egokitu den [[erregresio (argipena)|erregresio]]- zuzen bat agertzen da.]]
 
[[Korrelazio]]aren azterketaz bi [[aldagai kuantitatibo]]en arteko erlazio estatistikoaren norabidea eta sendotasuna ikertzen dira: batak gora egitean, besteak ere gora edo behera egiten duen eta erlazio hau oso argia den, alegia. [[Karratu txikienen erregresio zuzen|Erregresio]] tekniken bitartez, bi aldagaien arteko erlazio estatistikoa zehazten da, bata bestearen mendean utziz. Kasu bietan, oinarritzat hartu ohi den erlazio mota [[linealtasun (matematika)|lineala]] edo zuzen erakoa da; nahiz eta bestelako lerroak ere azter daitezkeen bertatik abiaturik. Erregresio eredu orokorretan, aldagai independentetzat aldagai anitz har daitezke, aldagai bat beste batzuen mendean utziz. Lerro horien egokitzapenaren kalitatea (menpeko aldagaiaren balio errealen eta egindako aurresanen gertutasuna) ere aztertzen da erregresio-tekniketan. Nolanahi ere, korrelazio- eta erregresio-analisietan tentuz jokatu behar izaten da beste aldagaien eragina eta datuetan izan daitezkeen aparteko joerak kontrolatzen.
=== Bariantza-analisia eta esperimentuen diseinua ===
 
[[Bariantza-analisi]]a, nazioartean ''ANOVA'' izenez ezagutu ohi dena, aldagai baten aldakortasuna, [[bariantza]]ren bitartez neurtzen dena, faktore edo eragile zenbaiten efektuengatiko osagaietan zatitzen du. [[Hipotesi-froga|Hipotesi-kontraste]] baten bitartez, faktore bakoitza eragingarritzat jo edota hautemandako aldakortasuna zoriari egotzi behar zaion erabakitzen da. Bariantza analisia [[esperimentu-diseinu]]an erabiltzen da bereziki, non aztergai den aldagai bat kontrolatzen diren beste aldagai batzuen mendean aztertzen den. Kontrolatzen diren aldagaiak, elementuak eta beraien arteko erlazioak zein diren, esperimentu-diseinu mota asko daude, ordea; esperimentu-egoera bakoitzean, bariantza-analisiak azterketa estatistiko egokiena zehaztuko du.
 
=== Aldagai anitzeko analisia ===
 
[[Aldagai anitzeko analisi]]ak aldagai kopuru handia (nahiz eta teorian aldagai bi eta bakarreko datu multzoetarako ere aplika daitekeen) jasotzen duten datu-multzoak aztertzen dituzten teknika estatistikoak biltzen ditu. Helburua datu-multzoak duen aldagai edo ''dimentsio-kopurua'' murriztea da, datu-multzo osoa laburbiltzen duten faktoreak zehaztuz. Bide batez, datu-multzoetan jaso diren elementuak (herriak, non aldagai sozioekonomikoen kopuru handia jaso diren, adibidez) modu sinplean irudikatu ere egiten dira, antzekoak diren elementuak hautemanez. Horretarako teknikak dira [[analisi faktorial]]a eta [[osagai nagusien analisi]]a. Beste teknika batzuetan, dependentzia-erlazioak bilatzen dira, hala nola [[erregresio (argipena)|erregresio]] eredu orokorra, bi aldagai soilik lotzeaz haraindi aldagai independentetzat aldagai multzo bat hartzen duena eta [[MANOVA]] eta [[MANCOVA]] analisi motak, bariantza-analisiaren menpeko aldagai anitzeko bertsio direnak. Beste alde batetik, ''clustering'' edo [[multzokatze (estatistika)|multzokatze]] izeneko teknikan jasotako aldagai guztiei buruz antzekoak diren elementuak multzoetan sailkatzen ditu. [[Analisi diskriminatzaile]]aren bitartez, berriz, elementu batera aurrez ezarritako multzoetako batera bilduko den aurresaten da. [[Eskalatze multidimensional]]ean elementuak bi dimentsioetako mapa batean kokatzen dira, hainbat aldagaitan hartzen dituzten balioak eta distantziak ahalik eta modu fidagarrienean azaltzeko. [[Korrespondentzia-analisi]]an [[kontingentzia taula|kontingentzia tauletan]] bildutako [[aldagai kategorikokualitatibo|aldagai kategorikoak]]ak laburbildu eta irudikatzen ditu. Oro har, teknika hauek guztiek [[aljebra lineal]]a modu intentsiboan erabiltzen dute, datuak euren [[matrize]] bidezko adierazpenetik aztertzen badira.
 
=== Laginketa ===
=== Denbora serieen analisia ===
 
[[Denbora serie]]ak denboran zehar aldagai bat edo batzuen bilakaera adierazten duten datu-multzoak dira. Estatistikak denbora serieen bilakaera aurresateko teknikak garatzen ditu bereziki, iraganeko bilakaeran oinarrituta. Horietan, [[ARIMA (estatistika)|ARIMA]] izeneko eredu konplexuak dira zientzia arloan gehien erabiltzen direnak baina azterketa sinpleagoak egiteko prozedura sinpleak ere badaude. Nola nahi ere, azterketarako denbora serie bat joera, [[ziklo (argipena)|zikloa]]a eta [[urtarokotasun]] osagaiek zehazten dutela pentsatzen da, aurresanezina den [[zori]]zko osagai batekin batera.
 
=== ''Data mining'' edo datu-meatzaritza ===
 
[[Datu-meatzaritza]] [[XX. mendemendea]]arenren bigarren erdian garatu den diziplina arteko arloa da, estatistika, [[adimen artifizial]]a eta [[erabaki-teoria]] uztartuz. Bere helburua [[datu-base]] handien azterketarako metodo eraginkorrak bilatzea da, modu azkar batez datuetan egon daitezkeen egiturak hautemateko<ref>{{en}} {{Erreferentzia
|izena=David J.
|abizena=Hand
[[Fitxategi:Misusestatistics 0001.png|thumb|right|220px|Bi urtetan zehar izandako 40 eta 50eko salmentak irudikatzean, jatorria 40tik gertu jartzen bada, gehikuntza askoz ere handiagoa dela erakusten da, modu engainagarrian ''(ezkerrean)''. Gehikuntza erreala erakusteko, zutabeak jatorritik altxatu behar dira ''(eskuinean)''. Erreferentziaren aldaketa nahiz aipamen eza emaitza eta interpretazio okerren iturburua izaten da.]]
 
Ezjakintasunez, estatistika [[manipulazio (argipena)|manipulazio]] tresna moduan erabiltzeagatik nahiz modu egokian interpretatzen ez direlako, estatistikaren emaitzak mesfidantzaz hartu ohi dira publikoaren artean. Estatistikaren metodoak matematikoak dira, modu zientifikoan garatu dira eta erabat fidagarriak dira, ordea; horrela, estatistikaren erabilera okerra da, eta ez estatistika bera, zuzenak ez diren emaitzak eta konklusioak azaltzera eramaten duena. Ikerketetan eta hedabideetan agertzen diren akats estatistikoak saihesteko, bereziki estatistikan trebatutako adituen laguntza gomendatzen da, estatistikaren metodoak erabili nahiz horiek modu egokian plazaratzeko<ref>{{en}} {{Erreferentzia
|izena=Christopher
|abizena=Bruce
Hainbat dira estatistika gaizki erabili eta horren emaitzak gaizki interpretatzen direneko egoerak. Ohiko okerrak dira honako hauek:
 
* [[batezbesteko]]ak populazio osora zabaltzea; izan ere, pertsonen batezbesteko soldata 1500 eurokoa denean, ez da ulertu behar pertsona guztiek edo gehienek 1500 euro jasotzen dutenik; izan ere, batezbestekoak populazioko elementuak zein balioren ''inguruan'' biltzen diren adierazten du eta inguru hori zabalagoa edo estuagoa izan daiteke egoera batetik bestera; hori guztia dela eta, batezbestekoekin batera [[sakabanatze neurri(estatistika)|sakabanatze neurriren]]ren bat erabiltzea gomendatzen da<ref name=misuse>{{en}} Dodhia, Rahul (2007): [http://www.ravenanalytics.com/Articles/Misuse%20of%20statistics.pdf Misuse of Statistics], ''www.ravenanalytics.com'', 2012-03-06an kontsultatua.</ref>;
* [[korrelazio]]tik [[kausalitate|kausa]] ondorioztatzea; izan ere, estatistikoki bi aldagai loturik egoteak ez dakar besterik gabe bata bestearen kausa izatea, lotura hori halabeharrezkoa edo bi aldagaiekin loturik dagoen beste hirugarren aldagai batek eragindakoa izan daitekeelako<ref>{{en}} {{Erreferentzia
|url=http://www.jstor.org/discover/10.2307/2281124?uid=23478&uid=3737952&uid=2&uid=3&uid=67&uid=23471&uid=62&sid=47698716515847
|izenburua=Spurious correlation: a causal interpretation
Estatistikak bi alde ditu: batetik, metodo estatistikoaren oinarriak eta teknikak garatzen dituen '''estatistika teorikoa''' edo '''estatistika matematikoa''', jakintza arlo zientifiko bateratua dena; bestetik, metodo horiek egokitu eta aplikatu dituzten arloak, '''estatistika aplikatua''' izenburupean. Aplikazioei dagokienean, estatistika [[metodo zientifiko]]a oinarritzen diren zientzia eta jakintza arlo guztietan erabiltzen da: datuak non, han baliatu behar da estatistika horien azterketa egiteko.
 
Aplikazio arloa zein den, metodo estatistiko bereziak erabili behar dira eta sarri metodo orokorrak egokitu egin behar izaten dira. Hori dela eta, jakintza arlo bakoitzean, horretarako metodo estatistiko bereziak garatu eta aztertzen dituzten diziplinak daude, hala nola, [[ekonometria]], ekonomian; [[epidemiologia]], medikuntzan; [[psikometria]], psikologian; [[bioestatistika]], biologian; [[astroestatistika]], [[astronomia]]n; [[merkatu ikerketa|merkatu-ikerketa]], [[marketin]]en; [[geoestatistika]], lur-zientzietan; [[antropometria]] eta abar. Izen berezirik gabe, estatistikak rol garrantzitsua betetzen ditu beste zientzia eta diziplina askotan, hala nola [[soziologia]]n (pertsonak hautatzeko laginketa-metodoak baliatuz, adibidez), [[enpresa]] ([[kalitate-kontrol]]ean, besteak beste), [[finantzfinantzak|finantzetan]]etan (denbora serieak aztertuz, aktiboen kotizazioen aurresanak egiteko) eta [[ingeniaritza]]n (sistemen fidagarritasunari buruzko datuak jaso eta aztertzeko, besteak beste). Estatistika-metodoak baliatu eta garatu egiten dituzten diziplina arteko arlo aplikatuak ere sortu dira, hala nola [[ilara-teoria]].
 
=== Ekonometria ===
 
[[Ekonometria]] [[teoria ekonomiko]]a, [[matematika]] eta estatistika bateratzen dituen arloa da, teoria eta behaketak uztartuz. [[Ziklo ekonomiko]]a (denbora serieen azterketaren bitartez), aldagai makroekonomikoen arteko erlazioak (adibidez, eskariaren erta prezioaren artean, [[erregresio (argipena)|erregresio]]-ereduen bitartez) eta prezioen bilakaera azaltzen duten [[zenbaki indize]]en eraketarako metodologia aztertzen ditu. Teoria ekonomikoak garatutako ereduetako parametroen zenbatespena, diagnostikoa (datuak bat datozen zehaztutako ereduarekin) eta eredu horiek erabiliz, aurresanak ere egiten ditu.
 
=== Demografia ===
=== Epidemiologia ===
 
[[Epidemiologia]], [[medikuntza]]ren baitan, [[gaixotasuneritasun|gaixotasunek]]ek eta osasunarekin loturiko gertaerek populazioetan duten banaketa, adina, elikadura, ohiturak eta beste [[arrisku (segurtasuna)|arrisku]]-faktoreak kontuan hartuz, aztertzen duen jakintza-arloa da. [[Osasun publiko]]aren baitan garrantzi berezia du, arduradunei osasun-politika eta [[prebentzio (medikuntza)|prebentzio]]-neurriak hartzeko oinarrian baitago.
 
=== Psikometria ===
 
=== Geoestatistika ===
[[Fitxategi:Global Warming Predictions Map.jpg|thumb|right|250px|Datu [[meteorologikometeorologia|meteorologikoak]]ak estatistikaz aztertuz, [[berotze globala]]ri buruzko aurresanak egin daitezke.]]
 
[[Geoestatistika]]k [[geologia]], [[ozeanografia]], [[meteorologia]], [[astronomia]] eta beste lur-zientzietan jasotzen diren datuak, gehienetan espazioan eta denboran zehar banaturik daudenak, aztertzen ditu. Horren baitan garatu den berariazko teknika bat ''[[kriging]]'' izenekoa da, datuak jaso diren puntuen arteko interpolazioak burutzen dituena. Datu horiek jasotzean izaten diren neurketa-erroreen azterketaz ere arduratzen da geoestatistika.
=== Merkatu-ikerketa ===
 
[[Merkatu- ikerketa|Merkatu-ikerketan]]n kontsumitzaileek profilak osatu eta lehiakideen analisia egiten da. Horretarako, [[inkesta]] bidez eta behaketa zuzenaz jasotzen diren datuak aztertzen dira, produktuen eta kontsumitzaileen arteko ezberdintasunak azalerazteko.
 
== Estatistika ofiziala ==
 
Estatistikaren zeregina ere bada [[estatu]] bateko informazio ekonomiko, administratibo, [[demografia|demografiko]] eta [[ingurumen]]ari buruzkoa, ''estatistikak'' alegia, jaso eta hedatzea. Horretarako, gobernuek [[estatistika ofizial|estatistika-erakunde ofizialak]] kudeatzen dituzte, udal eta beste gobernu erakundeek ere euren estatistika-datuak plazaratzen dituzten arren. Nazioarteko erakundeek ere estatistiken hornitzaile nabarmenak dira. Informazio horren hartzaileak hiritarrak, euren informazio-eskubidea bermatuz, enpresak eta beste erakundeak, erabakiak hartzeko oinarri moduan, eta ikertzaileak dira. Historian zehar, [[zentsu (estatistika)|zentsuak]] eta [[errolda]]k izan dira informazio hori biltzeko tresnak; egun [[laginketa]]ren bitartez herri, eskualde nahiz herrialde bateko informazio fidagarria osatzen da. Horretaz gainera, estatistika ofizialaren jarduerak zenbait printzipio jarraitu behar ditu, hala nola pertsonen datuen [[konfidentzialtasun]]a atxikitzea; herrialde ezberdinetako alderagarriak izan daitezen, datuak nazioartean adostutako irizpide komunei jarraiki bildu eta plazaratzea eta datu bilketa eta estatistiken eraketa onartutako irizpide zientifikoetan oinarrituta burutzea, edonolako manipulazio politiko baztertuz<ref>{{en}} [http://unstats.un.org/unsd/methods/statorg/FP-English.htm Fundamental Principles of Official Statistics], ''United Nations Statistics Division'', 2012-02-21ean kontsultatua.</ref>.
 
Estatistika ofizialek honako hauek hartzen dituzte, besteak beste, bere baitan: biztanleria datuak (herri, sexu eta adinaren arabera), bizi-itxaropenak, [[Barne produktu gordin|BPG]] hazkundea, [[lanagabezia]]ri buruzko datuak, ekoizpen eta prezioen bilakaerari buruzko datuak ([[Kontsumorako Prezioen Indizea]], kasu) sektore ekonomikoaren eta produktu motaren arabera, enpresa-kopuruak eta horien tamaina sektorearen arabera, osasun arloko estatistikak (heriotza-adinak, gaixotasunen prebalentzia) eta hezkuntzari buruzko datuak (maila eta ikastegi-motaren arabera).
 
:::::::::::'''Estatistika erakunde ofizial zenbait'''
{{Col-break|width=20%}}
'''Mundu zabalean'''
* ''[http://unstats.un.org/unsd/default.htm United Nations Statistics Division]'', [[Nazio BatuBatuen Erakundea|Nazio Batuen]]en estatistika erakundea;
* [[Ameriketako Estatu Batuetako Zentsu Bulegoa]], [[Ameriketako Estatu Batuak|Estatu BatuBatuetan]]etan;
* [[Txinako Estatistika Bulego Nagusia]], [[TxinaTxinako Herri Errepublika|Txinan]]n;
* ''[[Goskomstat]]'', [[Errusia]]n;
* ''[[Instituto Brasileiro de Geografia e Estatística]]'', IBGE, [[Brasil]]en;
252.705

edits