Ireki menu nagusia

Aldaketak

t
ez dago edizio laburpenik
[[Fitxategi:Bundesarchiv Bild 183-C1228-0015-001, Berlin, Volkszählung.jpg|thumb|right|250px|Estatistikan, [[datu]]ak jasotzeko ohiko metodo bat [[inkesta]] da ''(irudian)''. Jasotako datuak populazio osoaren adierazgarri izan daitezen, inkestarako aukeratzen diren pertsonak, [[lagin (estatistika)|lagina]] osatzen dutenak hain zuzen, [[zori]]z aukeratu behar dira.]]
Estatistika ikerketa bat [[populazio (estatistika)|populazio]] bat eta bertan jasoko diren [[aldagai]]ak zehatz definituz abiatzen da, ikergai den eremua zehaztuko dutena. Erabili beharreko estatistika teknikak zehazterakoan, aldagaiak [[aldagai kuantitatibo|kuantitatiboak]] edo [[aldagai kualitatibo|kualtitatiboakkualitatiboak]] diren hartu behar da kontuan. Populazio horren gainean datuak jasotzerakoan bi prozedura izaten dira aukeran: [[zentsu (estatistika)|zentsua]], non populazioko elementu guztien datuak biltzen diren; eta [[laginketa]], non populazioko elementu batzuk soilik jasotzen diren, [[lagin (estatistika)|lagin]] bat osatzeko. Datuek populazio bateko lagina osatzen dutenean, lagina populazioaren adierazgarria izan dadila saiatu behar da; horretarako lagina osatzen duten elementuak [[zori]]z aukeratu behar dira, ikerketan izan daitezkeen alborapenak baztertuz. Datuak [[saiakuntza]]z nahiz behaketaz ([[inkesta]] bat burutuz, adibidez) jaso daitezke. Saiakuntzaren kasuan, aldagaiak eta [[errore esperimental]]a kontrolatzeko teknika estatistiko bereziak daude; behaketazko ikerketetan, berriz, inkesta eta datu-bilketa zorrotz diseinatu eta planifikatu behar dira, datu bilketak zenbatespen estatistikoetan [[alborapen (estatistika)|alborapenik]] ez sorrarazteko. Adibidez, etxez etxeko inkestak egiten badira etxe bakoitzean bizi den pertsona kopuruaz galdezka, pertsona asko bizi diren etxeetan atea zabaltzeko probabilitatea handiagoa da eta txikiagoa pertsona bakarra bizi den etxeetan; erantzunik jaso ez den etxeak baztertzen badira, etxeko pertsona kopurua gehiegiz zenbatesteko joera izango da.
 
Nolanahi ere, datu bilketa [[zeharkako datu]]ak (une jakin batean multzo bateko elementuen gainean datuak jasotzen direnean) nahiz [[luzetarako datu]]ak (elementu berdinen gainean, datuak denboran zehar jasotzen direnean) osatuz egin daiteke; sailkapen horrek ere teknika estatistiko bereiziak ekartzen ditu. Beste irizpide baten arabera, azterketa estatistiko baterako hartzen diren datuak lehen mailakoak (estatistikaren erabiltzaileak berariaz jaso dituenak) nahiz bigarren mailakoak (beste ikerketa batean jasotakoak) izan daitezke: lehen mailako datuak ikertzaileak zehazturiko helburuei jarraiki jasotzen diren bitartean, bigarren mailako datuetara eta horiek jasotzeko erabili den metodologiara moldatu beharra dago, estatistikaren erabiltzailearen zeregina kondizionatuz horrela<ref>{{en}} {{Erreferentzia
[[Fitxategi:Fisher iris versicolor sepalwidth.svg|thumb|right|200px|Estatistikaren ohiko metodologia da datuetara egokitzen diren [[eredu]]ak eratzea (irudian, [[histograma]] batez irudikatutako [[banakuntza normal]]a.]]
 
Deskribapenaz haraindi doa estatistika: datuen aldakortasunaren iturburua zorizkotasuna denez, [[probabilitate-teoria]]k datuak eta populazioak [[matematika]] eta [[probabilitate]] kontzeptua erabiliz islatzen dituzten ereduak zehazten ditu. Eredu hauek zehaztu gabeko [[parametro (estatistika)|parametroak]] izaten dituzte, datuak aztertuz kuantifikatuko direnak. Probabilitate-teoriak eredu hauen propietateak, ondorioak eta beraien arteko erlazioak ere aztertzen ditu. Probabilitatearen eta datuen arteko lotura [[maiztasun (estatistika)|maiztasuna]] da: adibidez, ikasgela batean maila bat gainidutgainditu dutenak %70 badira, maila gainditzeko probabilitatea 0.7 dela zenbatesten da.
 
Horrela, [[inferentzia estatistiko]]aren xedea datuak aukeratutako probabilitate-eredura doitzea da. Horretarako, ereduaren [[parametro (estatistika)|parametroak]] zenbatetsi egin behar dira datuek osatzen duten [[lagin (estatistika)|laginean]] oinarrituz. Adibidez, 15 urteko mutilen altuerak eta pisuak, kartesiar diagrama batean jarrita, ez dira guztiz egokitzen zuzen batera, baina zuzena eredu onargarria eta erosoa izan daiteke datu multzoa deskribatu eta sakonago aztertzeko; [[zuzenaren ekuazio]]a, zuzenaren parametroak alegia, datuetan oinarrituz zenbatetsi behar dira. Parametroen zenbatespenek errorerik badute, noski, datuen zorizkotasunak eta populazio batetik eratorritako lagina izateak eragindakoa. Errorearen neurria izateko, [[konfidantzakonfiantza-tarte]]ak erabiltzen dira. Parametro ezezagunak kuantifikatzeko beste modu bat horien balioa finkatu eta datuak balio horrekin bat datozen aztertzea da, [[hipotesi-kontraste]] baten bitartez. Parametroetan zentraturiko estatistikaren aukera moduan, [[estatistika ez parametriko]] izeneko arloa dago, datuei eredurik egotzi gabe, populazioen ezaugarriei buruzko hipotesiak egiaztatzen dituena.
 
Ikerketa zientifikoetan inferentzia estatistikoak eskaintzen dituen teknikak erabiltzen dira egun, zehatzagoak eta zorrotzagoak baitira, eta estatistika deskribatzailea datuak esploratu, zein eredu mota izan daitekeen egokiena erabakitzeko, edota publikora zabaltzeko soilik erabiltzen da. Esplorazio-helburua nabarmenduz, [[datuen azterketa esploratzaile]] izeneko teknika multzoa garatu zen XX. mendearen mendean, ereduen zurruntasuna kritikatu eta bereziki tresna grafikoak proposatzen dituena, ereduetan [[muturreko datu]]ek duten eragina nabarmenduz eta horiek hautemateko prozedurak ezarriz.
[[Fitxategi:Linear least squares.svg|thumb|right|200px|Kartesiar diagraman irudikatzen diren bi aldagaiek (datuak gorriz adierazten dira) [[korrelazio]] positiboa dute: batak gora egitean, besteak ere gora egiten du. Urdinez datuetara egokitu den [[erregresio]]- zuzen bat agertzen da.]]
 
[[Korrelazio]]aren azterketaz bi [[aldagai kuantitatibo]]en arteko erlazio estatistikoaren norabidea eta sendotasuna ikertzen dira: batak gora egitean, besteak ere gora edo behera egiten duen eta erlazio hau oso argia den, alegia. [[Karratu txikienen erregresio zuzen|Erregresio]] tekniken bitartez, bi aldagaien arteko erlazio estatistikoa zehazten da, bata bestearen mendean utziz. Kasu bietan, oinarritzat hartu ohi den erlazio mota [[linealtasun (matematika)|lineala]] edo zuzen erakoa da; nahiz eta bestelako lerroak ere azter daitezkeen bertatik abiaturik. Erregresio eredu orokorretan, aldagai independentzatindependentetzat aldagai anitz har daitezke, aldagai bat beste batzuen mendean utziz. Lerro horien egokitzapenaren kalitatea (aldagaimenpeko dependentearenaldagaiaren balio errealen eta egindako aurresanen gertutasuna) ere aztertzen da erregresio-tekniketan. Nolanahi ere, korrelazio- eta erregresio-analisietan tentuz jokatu behar izaten da beste aldagaien eragina eta datuetan izan daitezkeen aparteko joerak kontrolatzen.
 
=== Bariantza-analisia eta esperimentuen diseinua ===
=== Aldagai anitzeko analisia ===
 
[[Aldagai anitzeko analisi]]ak aldagai kopuru handia (nahiz eta teorian aldagai bi eta bakarreko datu multzoetarako ere aplika daitekeen) jasotzen duten datu-multzoak aztertzen dituzten teknika estatistikoak biltzen ditu. Helburua datu-multzoak duen aldagai edo ''dimentsio-kopurua'' murriztea da, datu-multzo osoa laburbiltzen duten faktoreak zehaztuz. Bide batez, datu-multzoetan jaso diren elementuak (herriak, non aldagai sozioekonomikoen kopuru handia jaso diren, adibidez) modu sinplean irudikatu ere egiten dira, antzekoak diren elementuak hautemanez. Horretarako teknikak dira [[analisi faktorial]]a eta [[osagai nagusien analisi]]a. Beste teknika batzuetan, dependentzia-erlazioak bilatzen dira, hala nola [[erregresio]] eredu orokorra, bi aldagai soilik lotzeaz haraindi aldagai independentetzat aldagai multzo bat hartzen duena eta [[MANOVA]] eta [[MANCOVA]] analisi motak, bariantza-analisiaren aldagaimenpeko dependentealdagai anitzeko bertsio direnak. Beste alde batetik, ''clustering'' edo [[multzokatze (estatistika)|multzokatze]] izeneko teknikan jasotako aldagai guztiei buruz antzekoak diren elementuak multzoetan sailkatzen ditu. [[Analisi diskriminatzaile]]aren bitartez, berriz, elementu batera aurrez ezarritako multzoetako batera bilduko den aurresaten da. [[Eskalatze multidimensional]]ean elementuak bi dimentsioetako mapa batean kokatzen dira, hainbat aldagaitan hartzen dituzten balioak eta distantziak ahalik eta modu fidagarrienean azaltzeko. [[Korrespondentzia-analisi]]an [[kontingentzia taula|kontigentziakontingentzia tauletan]] bildutako [[aldagai kategoriko]]ak laburbildu eta irudikatzen ditu. Oro har, teknika hauek guztiek [[aljebra lineal]]a modu intentsiboan erabiltzen dute, datuak euren [[matrize]] bidezko adierazpenetik aztertzen badira.
 
=== Laginketa ===
=== Denbora serieen analisia ===
 
[[Denbora serie]]ak denboran zehar aldagai bat edo batzuen bilakaera adierazten duten datu-multzoak dira. Estatistikak denbora serieen bilakaera aurresateko teknikak garatzen ditu bereziki, iraganeko bilakaeran oinarrituta. Horietan, [[ARIMA (estatistika)|ARIMA]] izeneko eredu konplexuak dira zientzia arloan gehien erabiltzen direnak baina azterketa sinplegoaksinpleagoak egiteko prozedura sinpleak ere badaude. Nola nahi ere, azterketarako denbora serie bat joera, [[ziklo]]a eta [[urtarokotasun]] osagaiek zehazten dutela pentsatzen da, aurresanezina den [[zori]]zko osagai batekin batera.
 
=== ''Data mining'' edo datu-meatzaritza ===
=== Demografia ===
 
[[Demografia]] giza-populazioen egitura eta bilakaera aztertzen dituen jakintza-arloa da. Horretarako, bereziki metodo estatistikoak erabiltzen ditu, hilkortasun-indizewindizea, [[bizi itxaropen]]a, jaiotza-tasa, ugalkortasun tasa eta populazioen dinamika azaltzen duten beste hainbat adierazle eratu eta aztertzeko.
 
=== Epidemiologia ===
=== Astroestatistika ===
 
AntzineanAitzinean, behaketa astronomikoetan gertatzen ziren erroreak [[batezbesteko]]ak eta beste zentro-nuerriakneurriak erabiliz kontrolatzen ziren. Egun, astroestatistikak [[teleskopio]] eta beste behaketa-gailuek sortzen dituzten datu-multzo itzelak aztertzeko teknikak, [[datu-meatzaritza]]ren baitan esaterako, baliatu behar ditu, unibertsoko objektuak fidagarritasunez aurkitu eta behar bezala sailkatzeko; orobat, estatistikaren altzotik asmatu diren irudien analisirako tresnak ere baliatu behar ditu<ref>{{en}} {{Erreferentzia
|izena1=Peter
|abizena1=Freeman
14.455

edits