Estatistika: berrikuspenen arteko aldeak

Ezabatutako edukia Gehitutako edukia
t Robota: Testu aldaketa automatikoa (-{{HezkuntzaPrograma}} +{{HezkuntzaPrograma|Matematika}})
definizioa Ingeles Wikipediatik hobetzea; eta beste
1. lerroa:
{{HezkuntzaPrograma|Matematika}}
[[Fitxategi:Loess curve.svg|thumb|300px|'''Estatistikak''' [[datu (argipena)|datuetan]] dauden joerak eta erregulartasunak bilatubilatzen eta zehaztu egitenzehazten ditu, natura eta giza fenomenoak argitze aldera. Irudian, errealitatetik jasotako datu-multzo bati estatistika-teknika batez egokitutako lerroa.]]
 
'''Estatistika''' fenomeno[[matematika]]ren aldakoradar etabat ziurgabeei buruzkoda, [[datu-multzo]]ak bildubiltzeaz, sailkatusailkatzeaz, irudikatuaztertzeaz, laburtuinterpretatzeaz eta aztertuaurkezteaz egitenarduratzen dituendena. metodoHelburutzat etadu prozeduren multzoa da,datu horien baitan dauden erregulartasunak eta erlazioak hautemanhautematea, horietarako [[eredu (argipena)|ereduak]] eratueratzea, aurresanakiragarpenak eginegitea, konklusio zehatzak emanematea, eta erabaki egokiak hartzearrenhartzea. Labur, estatistikaren helburua da jasotako datuetatik informazio baliagarria eskuratzeko teknikak garatu eta aplikatzea da. Horretarako, [[matematika]], [[probabilitate teoria]] eta [[erabaki-teoria]] oinarritzat hartzen ditu. Estatistikaren teknikak maila bitan erabiltzen dira: [[estatistika deskribatzaile]]an teknika sinple eta errazak erabiltzen dira datuak irudikatu eta laburtzeko; [[inferentzia estatistiko]]ak, berriz, azterketa konplexuago eta zorrotzagoa egiten du, datuak eredu matematiko batera egokitu eta berarekin duten [[errore estatistiko]]a neurtuz, [[probabilitate]] kontzeptuan oinarrituz horretarako. Egun funtsezko metodologia da ikerketa zientifikoan eta alor guztietan zabaltzen da bere erabilera, hala nola [[ekonomia]]n, [[medikuntza]]n, [[soziologia]]n eta [[meteorologia]]n. Hala ere, erabilera oker batengatik estatistika manipulazio eta erroreen iturburua izan da sarri; hori dela eta, estatistikaren emaitzak behar bezala interpretatzeko garrantzitsutzat jotzen dira estatistikaren [[dibulgazio|jendarteratzea]] eta estatistika-hezkuntza zorrotza, estatistika teknikak eta horietarako programa informatikoen aukerak tentuz baliatzeko.
 
Beste alde batetik, ''estatistikak'' terminoa edonolako datu multzoak, baina gehienetan erakunde publikoek argitaratutako datu ofizialak, adierazteko ere erabili ohi da (langabetuen estatistikak eta osasun estatistikak, esaterako). Estatistika ez da, ordea, datuak jasotzera mugatzen, harago doa eta datuen azterketarako metodologia ere hartzen du bere baitan.
8. lerroa:
== Historia ==
{{sakontzeko|Estatistikaren historia}}
XVII. eta XVIII. mendeetan estatistika terminoa sortu eta oinarrizko metodologia zientifiko bilakatu aurretik, anitzetan burutzen ziren datu bilketak. [[Antzinako Egipto]]n eta beste zibilizazio zaharretan ohizkoak ziren zentsuak. [[Erdi Aroa]]n ere ezagunak dira egindako datu bilketa batzuk, Ingalaterran egindako [[Domesday Book]] delakoa esaterako. Estatistika datuen azterketa moduan ikusi zuen lehenengo bidegilea [[John Graunt]] ingelesa izan zen XVII. mendean; Londresko datu [[demografia|demografikoak]] erabiliz, aurresanak eta beste ondorioak ateratzen ditu datuetatik. Demografiari buruzko ikerketak eta estatuei buruzko datu ekonomiko eta politikoen bilketa eta azterketa ugaldu ziren XVIII. mendean, Alemanian sortu berria zen "''{{lang|de|statistik}}''" arloaren, datu-bilketa hutsa zena, eta, datuak biltzeaz gainera, horiek aztertu ere egiten zituen ''aritmetika politikoa'' delakoaren baitan, [[William Petty]] ingeles zientza gizonak garatu zuena. XVIII. mendean probabilitate teoria garatu zen eta horrela XIX. mendearen hasierarako estatistika probabilitate teoriarekin uztartzeko teoria osaturik zegoen, [[Pierre-Simon Laplace]] zientzia gizonari esker, besteak beste, [[banaketa normal]]ean eta beste kontzeptu batzuetan oinarrituz. XIX. mendea aplikazioak zientzia anitzetara hedatu ziren. [[Adolphe Quételet]] izan zen mende horretan estatistikaren erabileraren zabalkuntza bultzatzen dutenetako bat. XX. mendean, [[Ronald Fisher]] estatistikariak [[inferentzia estatistiko]]aren teoria garatu eta [[Andrei Kolmogorov]] sobietar matematikoak [[probabilitate]]aren axiomatika eratu zuen. [[Bayestar estatistika]] izeneko adarra ere mendean zehar garatutako [[erabaki-teoria]]n oinarritzen da. Hainbat [[aldagai (argipena)|aldagai]] batera aztertzen duen [[aldagai anitzeko analisi]]ko teknikak ere garatzen dira. Horiei guztiei eske, estatistikaren eraikin kontzeptuala osatu eta teknika eta eredu berrietarako oinarria finkaturik geratzen da XX. mendeko erdialderako. Hala ere, [[informatika]]ren garapenak aukera berriak zabaltzen ditu datu-multzo itzelak jaso eta aztertzeko, aldagai anitzeko analisiaren aplikazio masiborako bidea zabalduz eta [[datu-meatzaritza]] izeneko teknikak baliatuz.
 
== Estatistika zientzian ==
 
Errealitatea ezagutzeko eta zientziaren garapenerako [[enpirismo]] eta [[positibismo]] korronte [[epistemologia|epistemologikoak]] dira estatistika tresna zientifiko moduan balioesten dutenak. Korronte horien arabera ezaguera zentzumenezko esperientzian oinarritu behar da eta esperientzia horren analisia da, [[logika induktibo]] batean oinarritua, errealitatearen fenomenoak ulertzen ahalbidetzen duena. Logika induktiboan gertaeren errepikapenak ezaguera sendoak eratzeko balio du, maiz azaldu den gertaera batek etorkizunean ere gertatzeko aukera handiak baititu, kondizio berdinak gauzatzen badira; hain zuzen ere, estatistikaren oinarria gertaeren [[maiztasun (estatistika)|maiztasun]] eta [[probabilitate]]etan datza, eta horrela, logika induktibozko teknika moduan, hartzen du metodo zientifikoaren funtsezko osagaia izateko zilegitasuna.
 
17 ⟶ 16 lerroa:
 
== Estatistikaren metodologia ==
 
[[Fitxategi:Bundesarchiv Bild 183-C1228-0015-001, Berlin, Volkszählung.jpg|thumb|250px|Estatistikan, [[datu (argipena)|datuak]] jasotzeko ohiko metodo bat [[inkesta]] da ''(irudian)''. Jasotako datuak populazio osoaren adierazgarri izan daitezen, inkestarako aukeratzen diren pertsonak, [[lagin (estatistika)|lagina]] osatzen dutenak hain zuzen, [[zori]]z aukeratu behar dira.]]
Estatistika ikerketa bat [[populazio (estatistika)|populazio]] bat eta bertan jasoko diren [[aldagai (argipena)|aldagaiak]] zehatz definituz abiatzen da, ikergai den eremua zehaztuko dutena. Erabili beharreko estatistika teknikak zehazterakoan, aldagaiak [[aldagai kuantitatibo|kuantitatiboak]] edo [[aldagai kualitatibo|kualitatiboak]] diren hartu behar da kontuan. Populazio horren gainean datuak jasotzerakoan bi prozedura izaten dira aukeran: [[zentsu (estatistika)|zentsua]], non populazioko elementu guztien datuak biltzen diren; eta [[laginketa (estatistika)|laginketa]], non populazioko elementu batzuk soilik jasotzen diren, [[lagin (estatistika)|lagin]] bat osatzeko. Datuek populazio bateko lagina osatzen dutenean, lagina populazioaren adierazgarria izan dadila saiatu behar da; horretarako lagina osatzen duten elementuak [[zori]]z aukeratu behar dira, ikerketan izan daitezkeen alborapenak baztertuz. Datuak [[saiakuntza]]z nahiz behaketaz ([[inkesta]] bat burutuz, adibidez) jaso daitezke. Saiakuntzaren kasuan, aldagaiak eta [[behaketa-errore|errore esperimentala]] kontrolatzeko teknika estatistiko bereziak daude; behaketazko ikerketetan, berriz, inkesta eta datu-bilketa zorrotz diseinatu eta planifikatu behar dira, datu bilketak zenbatespen estatistikoetan [[alborapen (estatistika)|alborapenik]] ez sorrarazteko. Adibidez, etxez etxeko inkestak egiten badira etxe bakoitzean bizi den pertsona kopuruaz galdezka, pertsona asko bizi diren etxeetan atea zabaltzeko probabilitatea handiagoa da eta txikiagoa pertsona bakarra bizi den etxeetan; erantzunik jaso ez den etxeak baztertzen badira, etxeko pertsona kopurua gehiegiz zenbatesteko joera izango da.
 
Nolanahi ere, datu bilketa [[zeharkako datu]]ak (une jakin batean multzo bateko elementuen gainean datuak jasotzen direnean) nahiz [[luzetarako datuak]] (elementu berdinen gainean, datuak denboran zehar jasotzen direnean) osatuz egin daiteke; sailkapen horrek ere teknika estatistiko bereiziak ekartzen ditu. Beste irizpide baten arabera, azterketa estatistiko baterako hartzen diren datuak lehen mailakoak (estatistikaren erabiltzaileak berariaz jaso dituenak) nahiz bigarren mailakoak (beste ikerketa batean jasotakoak) izan daitezke: lehen mailako datuak ikertzaileak zehazturiko helburuei jarraiki jasotzen diren bitartean, bigarren mailako datuetara eta horiek jasotzeko erabili den metodologiara moldatu beharra dago, estatistikaren erabiltzailearen zeregina kondizionatuz horrela.<ref>{{en}} {{Erreferentzia
|hizkuntza=en
|izena=Gene V.
|abizena=Glass
28 ⟶ 27 lerroa:
|urtea=1976
|egunkaria=Educational Researcher
|url=http://www.jstor.org/pss/1174772}}.</ref>.
 
Datuak bildu ondoren, horiek [[maiztasun-banaketa|maiztasun-taula]] batean azaldu nahiz modu grafikoan irudikatu behar dira, datuak modu ulergarri batez plazaratu nahiz ondorengo azterketa zorrotz baterako esplorazio-tresna moduan. Horrekin batera eta helburu berdinez, ohikoa da datuak laburbiltzeko neurri, koefiziente eta teknika estatistiko sinpleak erabiltzea.
39 ⟶ 38 lerroa:
 
=== Estatistika deskribatzailea, probabilitate-teoria eta inferentzia estatistikoa ===
 
Estatistikaren eraketa teorikoa hiru hiru mailatan zatitu ohi da: [[estatistika deskribatzaile]]a, [[probabilitate teoria|probabilitate-teoria]] eta [[inferentzia estatistiko]]a. Zatiketa hori izaten da, gainera, estatistikaren irakaskuntzan modu ordenatuan jarraitzen dena, estatistika deskribatzailea estatistikaren sarrera moduan baliatuz. Probabilitate-teoria eta inferentzia estatistikoaren teknikak garatu eta horien baliozkotasuna frogatzeko matematika erabiltzen da. Hori dela eta, arlo horietako oinarri, kontzeptu eta teoremen multzoari [[estatistika matematiko]] deitu izan zaio.
 
Estatistika deskribatzaileak datuen deskribapen hutsa egiten du, teknika sinpleak erabiliz, datuak irudikatu eta laburtzeko. Aplikazio askotan ez da beharrezkoa zehaztasun handia eta datuen ezaugarri nagusienak lortu eta sinpletasunez erakusteko nahikoa izaten da. [[Datu-diagrama|Datu diagramak]], [[maiztasun-banaketa]]k, [[batezbesteko]]en eta [[bariantza]]ren kalkulua (banaketen zentroa eta [[sakabanatze (estatistika)|sakabanatzea]] neurtzeko, hurrenik hurren) eta bestelako [[estatistiko]] edo neurriak biltzen ditu estatistika deskribatzaileak. Aldagaien arteko erlazioak ere modu deskribatzaile batez azter daitezke, diagramak baliatuz nahiz [[korrelazio]]-koefizienteak kalkulatuz.
 
 
<div style="width:700px;background: #E6FFE6; border: 1px solid rgb(153, 153, 153); padding: 1em;">
49 ⟶ 46 lerroa:
Estatistikak tresna sinpleak ere eskaintzen ditu datuak aztertzeko: batzuetan nahikoak dira datuen tabulazioa eta batezbestekoaren kalkulua datuak laburbiltzeko.
 
''Adibidez, ikasgela bateko 25 haurren matematika-kalifikazioak jaso dira: 6-7-8-7-6-5-5-6-5-9-7-8-9-7-8-7-8-7-8-7-7-6-6-8-7; datuak [[maiztasun-banaketa|maiztasun-taula]] batean bilduz gehien agertzen den kalifikazioa 7 dela ikus daiteke; [[barra-diagrama|barra diagraman]] ere ikus daitekeenez. [[Batezbesteko aritmetiko sinple]]aren emaitzak ere notak 6.96 balioaren inguruan biltzen direla erakusten du.''
 
 
:::{| class="wikitable"| style="float: left;" border="1"
|-align="center"
! ''Kalifikazioa''
! ''Haurrak''
|-align="center"
| 5
77 ⟶ 73 lerroa:
| align="center" width="50" | [[Fitxategi:Barchart007.png|175px]]
|}
 
 
:::<math>\overline{x}=\frac{5 \times 3 + 6 \times 5 + 7 \times 9 + 8 \times 6 + 9 \times 2}{25}=6.96</math>
92 ⟶ 87 lerroa:
 
=== Korrelazio eta erregresio teknikak ===
 
[[Fitxategi:Linear least squares.svg|thumb|200px|Kartesiar diagraman irudikatzen diren bi aldagaiek (datuak gorriz adierazten dira) [[korrelazio]] positiboa dute: batak gora egitean, besteak ere gora egiten du. Urdinez datuetara egokitu den [[erregresio (argipena)|erregresio]]- zuzen bat agertzen da.]]
 
98 ⟶ 92 lerroa:
 
=== Bariantza-analisia eta esperimentuen diseinua ===
[[Bariantza-analisi]]a, nazioartean ''ANOVA'' izenez ezagutu ohi dena, aldagai baten aldakortasuna, [[bariantza]]ren bitartez neurtzen dena, faktore edo eragile zenbaiten efektuengatiko osagaietan zatitzen du. [[Hipotesi-froga|Hipotesi-kontraste]] baten bitartez, faktore bakoitza eragingarritzat jo edota hautemandako aldakortasuna zoriari egotzi behar zaion erabakitzen da. Bariantza analisia [[esperimentu-diseinu]]an erabiltzen da bereziki, non aztergai den aldagai bat kontrolatzen diren beste aldagai batzuen mendean aztertzen den. Kontrolatzen diren aldagaiak, elementuak eta beraien arteko erlazioak zein diren, esperimentu-diseinu mota asko daude, ordea; esperimentu-egoera bakoitzean, bariantza-analisiak azterketa estatistiko egokiena zehaztuko du.
 
[[Bariantza-analisi]]a, nazioartean ''ANOVA'' izenez ezagutu ohi dena, aldagai baten aldakortasuna, [[bariantza]]ren bitartez neurtzen dena, faktore edo eragile zenbaiten efektuengatiko osagaietan zatitzen du. [[Hipotesi-froga|Hipotesi-kontraste]] baten bitartez, faktore bakoitza eragingarritzat jo edota hautemandako aldakortasuna zoriari egotzi behar zaion erabakitzen da. Bariantza analisia [[esperimentu-diseinu]]an erabiltzen da bereziki, non aztergai den aldagai bat kontrolatzen diren beste aldagai batzuen mendean aztertzen den. Kontrolatzen diren aldagaiak, elementuak eta beraien arteko erlazioak zein diren, esperimentu-diseinu mota asko daude, ordea; esperimentu-egoera bakoitzean, bariantza-analisiak azterketa estatistiko egokiena zehaztuko du.
 
=== Aldagai anitzeko analisia ===
 
[[Aldagai anitzeko analisi]]ak aldagai kopuru handia (nahiz eta teorian aldagai bi eta bakarreko datu multzoetarako ere aplika daitekeen) jasotzen duten datu-multzoak aztertzen dituzten teknika estatistikoak biltzen ditu. Helburua datu-multzoak duen aldagai edo ''dimentsio-kopurua'' murriztea da, datu-multzo osoa laburbiltzen duten faktoreak zehaztuz. Bide batez, datu-multzoetan jaso diren elementuak (herriak, non aldagai sozioekonomikoen kopuru handia jaso diren, adibidez) modu sinplean irudikatu ere egiten dira, antzekoak diren elementuak hautemanez. Horretarako teknikak dira [[analisi faktorial]]a eta [[osagai nagusien analisi]]a. Beste teknika batzuetan, dependentzia-erlazioak bilatzen dira, hala nola [[erregresio (argipena)|erregresio]] eredu orokorra, bi aldagai soilik lotzeaz haraindi aldagai independentetzat aldagai multzo bat hartzen duena eta [[MANOVA]] eta [[MANCOVA]] analisi motak, bariantza-analisiaren menpeko aldagai anitzeko bertsio direnak. Beste alde batetik, ''clustering'' edo [[multzokatze (estatistika)|multzokatze]] izeneko teknikan jasotako aldagai guztiei buruz antzekoak diren elementuak multzoetan sailkatzen ditu. [[Analisi diskriminatzaile]]aren bitartez, berriz, elementu batera aurrez ezarritako multzoetako batera bilduko den aurresaten da. [[Eskalatze multidimensional]]ean elementuak bi dimentsioetako mapa batean kokatzen dira, hainbat aldagaitan hartzen dituzten balioak eta distantziak ahalik eta modu fidagarrienean azaltzeko. [[Korrespondentzia-analisi]]an [[kontingentzia taula|kontingentzia tauletan]] bildutako [[aldagai kualitatibo|aldagai kategorikoak]] laburbildu eta irudikatzen ditu. Oro har, teknika hauek guztiek [[aljebra lineal]]a modu intentsiboan erabiltzen dute, datuak euren [[matrize]] bidezko adierazpenetik aztertzen badira.
 
=== Laginketa ===
 
[[Populazio (estatistika)|Populazio]] baten adierazgarri den [[lagin (estatistika)|lagin]] bat osatzeko, elementuak [[zorizko laginketa]]z jaso behar direla jakina da. Baldintza horrek datuak jasotzeko modu anitz uzten ditu zabalik. [[Laginketa]]-teoriak modu horiek garatu egiten dituen estatistikaren arloa da. Populazioaren ezaugarriak zein diren, [[laginketa geruzatu]]a, [[konglomeratuzko laginketa]], [[etapa anitzeko laginketa]] eta [[laginketa sistematiko]]a izeneko prozedurak asmatu eta aztertu dira. Baliatu beharreko laginketa prozeduraz gainera, laginketak errore eta zehaztasun jakin bateko zenbatespenetarako osatu beharreko [[lagin tamaina]]ren kalkulua ere aztertzen du. Horren aplikazioak zabalak dira [[demoskopia]] eta beste ikerketa soziologiko eta demografikoetan, baina baita natura zientzietan ere (adibidez, biologian espezie bateko laginak osatzerakoan).
 
=== Denbora serieen analisia ===
 
[[Denbora serie]]ak denboran zehar aldagai bat edo batzuen bilakaera adierazten duten datu-multzoak dira. Estatistikak denbora serieen bilakaera aurresateko teknikak garatzen ditu bereziki, iraganeko bilakaeran oinarrituta. Horietan, [[ARIMA (estatistika)|ARIMA]] izeneko eredu konplexuak dira zientzia arloan gehien erabiltzen direnak baina azterketa sinpleagoak egiteko prozedura sinpleak ere badaude. Nola nahi ere, azterketarako denbora serie bat joera, [[ziklo (argipena)|zikloa]] eta [[urtarokotasun]] osagaiek zehazten dutela pentsatzen da, aurresanezina den [[zori]]zko osagai batekin batera.
 
=== ''{{lang|en|Data mining}}'' edo datu-meatzaritza ===
[[Datu-meatzaritza]] [[XX. mendea]]ren bigarren erdian garatu den diziplina arteko arloa da, estatistika, [[adimen artifizial]]a eta [[erabaki-teoria]] uztartuz. Bere helburua [[datu-base]] handien azterketarako metodo eraginkorrak bilatzea da, modu azkar batez datuetan egon daitezkeen egiturak hautemateko.<ref>{{en}} {{Erreferentzia
 
|hizkuntza=en
[[Datu-meatzaritza]] [[XX. mendea]]ren bigarren erdian garatu den diziplina arteko arloa da, estatistika, [[adimen artifizial]]a eta [[erabaki-teoria]] uztartuz. Bere helburua [[datu-base]] handien azterketarako metodo eraginkorrak bilatzea da, modu azkar batez datuetan egon daitezkeen egiturak hautemateko<ref>{{en}} {{Erreferentzia
|izena=David J.
|abizena=Hand
121 ⟶ 111 lerroa:
|urtea=1998
|egunkaria=The American Statistician
|url=http://www.jstor.org/stable/2685468?seq=1}}.</ref>.
 
== Estatistikaren erabilera okerra ==
127 ⟶ 117 lerroa:
[[Fitxategi:Misusestatistics 0001.png|thumb|220px|Bi urtetan zehar izandako 40 eta 50eko salmentak irudikatzean, jatorria 40tik gertu jartzen bada, gehikuntza askoz ere handiagoa dela erakusten da, modu engainagarrian ''(ezkerrean)''. Gehikuntza erreala erakusteko, zutabeak jatorritik altxatu behar dira ''(eskuinean)''. Erreferentziaren aldaketa nahiz aipamen eza emaitza eta interpretazio okerren iturburua izaten da.]]
 
Ezjakintasunez, estatistika [[manipulazio (argipena)|manipulazio]] tresna moduan erabiltzeagatik nahiz modu egokian interpretatzen ez direlako, estatistikaren emaitzak mesfidantzaz hartu ohi dira publikoaren artean. Estatistikaren metodoak matematikoak dira, modu zientifikoan garatu dira eta erabat fidagarriak dira, ordea; horrela, estatistikaren erabilera okerra da, eta ez estatistika bera, zuzenak ez diren emaitzak eta konklusioak azaltzera eramaten duena. Ikerketetan eta hedabideetan agertzen diren akats estatistikoak saihesteko, bereziki estatistikan trebatutako adituen laguntza gomendatzen da, estatistikaren metodoak erabili nahiz horiek modu egokian plazaratzeko.<ref>{{en}} {{Erreferentzia
|hizkuntza=en
|izena=Christopher
|abizena=Bruce
133 ⟶ 124 lerroa:
|egunkaria=Expert Witness
|urtea=2004
|url=http://www.economica.ca/ew09_4p1.htm}}.</ref>.
 
Hainbat dira estatistika gaizki erabili eta horren emaitzak gaizki interpretatzen direneko egoerak. Ohiko okerrak dira honako hauek:
 
* [[batezbesteko]]ak populazio osora zabaltzea; izan ere, pertsonen batezbesteko soldata 1500 eurokoa denean, ez da ulertu behar pertsona guztiek edo gehienek 1500 euro jasotzen dutenik; izan ere, batezbestekoak populazioko elementuak zein balioren ''inguruan'' biltzen diren adierazten du eta inguru hori zabalagoa edo estuagoa izan daiteke egoera batetik bestera; hori guztia dela eta, batezbestekoekin batera [[sakabanatze (estatistika)|sakabanatze neurriren]] bat erabiltzea gomendatzen da;<ref name=misuse>{{en}} Dodhia, Rahul (2007): [http://www.ravenanalytics.com/Articles/Misuse%20of%20statistics.pdf Misuse of Statistics], ''www.ravenanalytics.com'', 2012-03-06an kontsultatua.</ref>;
* [[korrelazio]]tik [[kausalitate|kausa]] ondorioztatzea; izan ere, estatistikoki bi aldagai loturik egoteak ez dakar besterik gabe bata bestearen kausa izatea, lotura hori halabeharrezkoa edo bi aldagaiekin loturik dagoen beste hirugarren aldagai batek eragindakoa izan daitekeelako;<ref>{{en}} {{Erreferentzia
|hizkuntza=en
|url=http://www.jstor.org/discover/10.2307/2281124?uid=23478&uid=3737952&uid=2&uid=3&uid=67&uid=23471&uid=62&sid=47698716515847
|izenburua=Spurious correlation: a causal interpretation
144 ⟶ 136 lerroa:
|abizena=Simon
|egunkaria=Journal of the American Statistical Association
|urtea=1954}}.</ref>;
* aldaketa baten neurria kalkulatu edo irudikatu behar denean, aldaketa neurtzeko erabili den oinarria edo erreferentzia gisa balio ''normalak'' hartu behar dira; adibidez, enpresa bateko salmenten bilakaera adierazteko, hasierako balio edo oinarri moduan ez da aukeratu behar salmentak oso txikiak izan ziren urte bat, horrela datozen urteetako gehikuntzak puztuta agertuko baitira; beste alde batetik, oinarri eta erreferentzia moduan hartzen diren balioak adierazi behar dira beti, emaitzen perspektiba hobea izateko; adibidez, gazta jateagatik gaixotasun bat pairatzeko arriskua bikoiztu egiten dela baieztatzen bada, gazta jan gabe gaixotasun hori bizitza osoan pairatzeko probabilitatea 0.0001 eta, ondorioz, gazta janda probabilitatea 0.0002 dela ere aipatu egin behar da, gaixotzeko aukerak bi kasuetan murritzak direla argi uzteko;
* [[adierazgarritasun (estatistika)|adierazgarritasun estatistikoa]] gaizki interpretatzea; izan ere, emaitza estatistikoak adierazgarriak izateak horiek ziurtasun handiz baiezta daitezkeela esan nahi du eta ez emaitzak beraiek adierazgarriak direnik; adibidez, gizonezkoak ataza bat burutzerakoan denbora laburragoa ematen dutela adierazgarritasun handiz frogatzeak ez dakar bi sexuen arteko alde hori handia izan behar denik, oso txikia eta garrantzirik gabekoa izan baitaiteke.<ref name=misuse/>.
 
== Estatistika aplikatua ==
 
Estatistikak bi alde ditu: batetik, metodo estatistikoaren oinarriak eta teknikak garatzen dituen '''estatistika teorikoa''' edo '''estatistika matematikoa''', jakintza arlo zientifiko bateratua dena; bestetik, metodo horiek egokitu eta aplikatu dituzten arloak, '''estatistika aplikatua''' izenburupean. Aplikazioei dagokienean, estatistika [[metodo zientifiko]]a oinarritzen diren zientzia eta jakintza arlo guztietan erabiltzen da: datuak non, han baliatu behar da estatistika horien azterketa egiteko.
 
Aplikazio arloa zein den, metodo estatistiko bereziak erabili behar dira eta sarri metodo orokorrak egokitu egin behar izaten dira. Hori dela eta, jakintza arlo bakoitzean, horretarako metodo estatistiko bereziak garatu eta aztertzen dituzten diziplinak daude, hala nola, [[ekonometria]], ekonomian; [[epidemiologia]], medikuntzan; [[psikometria]], psikologian; [[bioestatistika]], biologian; [[astroestatistika]], [[astronomia]]n; [[merkatu ikerketa|merkatu-ikerketa]], [[marketin]]en; [[geoestatistika]], lur-zientzietan; [[antropometria]] eta abar. Izen berezirik gabe, estatistikak rol garrantzitsua betetzen ditu beste zientzia eta diziplina askotan, hala nola [[soziologia]]n (pertsonak hautatzeko laginketa-metodoak baliatuz, adibidez), [[enpresa]] ([[kalitate-kontrol]]ean, besteak beste), [[finantzak|finantzetan]] (denbora serieak aztertuz, aktiboen kotizazioen aurresanak egiteko) eta [[ingeniaritza]]n (sistemen fidagarritasunari buruzko datuak jaso eta aztertzeko, besteak beste). Estatistika-metodoak baliatu eta garatu egiten dituzten diziplina arteko arlo aplikatuak ere sortu dira, hala nola [[ilara-teoria]].
 
=== Ekonometria ===
 
[[Ekonometria]] [[teoria ekonomiko]]a, [[matematika]] eta estatistika bateratzen dituen arloa da, teoria eta behaketak uztartuz. [[Ziklo ekonomiko]]a (denbora serieen azterketaren bitartez), aldagai makroekonomikoen arteko erlazioak (adibidez, eskariaren erta prezioaren artean, [[erregresio (argipena)|erregresio]]-ereduen bitartez) eta prezioen bilakaera azaltzen duten [[zenbaki indize]]en eraketarako metodologia aztertzen ditu. Teoria ekonomikoak garatutako ereduetako parametroen zenbatespena, diagnostikoa (datuak bat datozen zehaztutako ereduarekin) eta eredu horiek erabiliz, aurresanak ere egiten ditu.
 
=== Demografia ===
 
[[Demografia]] giza-populazioen egitura eta bilakaera aztertzen dituen jakintza-arloa da. Horretarako, bereziki metodo estatistikoak erabiltzen ditu, hilkortasun-indizea, [[bizi itxaropen]]a, jaiotza-tasa, ugalkortasun tasa eta populazioen dinamika azaltzen duten beste hainbat adierazle eratu eta aztertzeko.
 
=== Epidemiologia ===
 
[[Epidemiologia]], [[medikuntza]]ren baitan, [[eritasun|gaixotasunek]] eta osasunarekin loturiko gertaerek populazioetan duten banaketa, adina, elikadura, ohiturak eta beste [[arrisku (segurtasuna)|arrisku]]-faktoreak kontuan hartuz, aztertzen duen jakintza-arloa da. [[Osasun publiko]]aren baitan garrantzi berezia du, arduradunei osasun-politika eta [[prebentzio (medikuntza)|prebentzio]]-neurriak hartzeko oinarrian baitago.
 
=== Psikometria ===
 
[[Psikometria]], [[psikologia]]ren baitan, nortasun eta portaera-ezaugarriak jaso eta neurtzeko teknika estatistikoak garatu eta aplikatzen ditu. Garrantzia berezia hartzen dute [[neurketa-maila|neurketa-eskalek]], hala nola [[Thurstone eskala]] eta [[Likert eskala]], eta ezaugarri horiek jasotzeko [[galde sorta]]ren diseinua aztertzen duten [[testen teoria klasiko]]a eta [[itemaren erantzun-teoria]].
 
=== Bioestatistika ===
[[Bioestatistika]]k [[biologia]]n (eta inguruko arlo aplikatuetan, [[agronomia]]n kasu) sarri burutzen diren saiakuntza-diseinu bereziak aztertzen ditu, zoriaren eta faktoreen eraginak kontrolatuz. Orobat, [[genetika]]n herentzia aztertzeko adibidez, probabilitate-eredu bereziak garatu behar ditu, ondoren jasoko diren datuekin alderatzeko. Organismo nahiz populazioetarako eratzen diren hazkunde-ereduak datuekin kontrastatu behar dira. Populazioen dinamika (adinak, biziraupena, ...) ere estatistikatik, zehatzago [[demografia]]tik, hartutako tresnen bitartez aztertzen da. Demografian ez bezala, ordea, zentsuak ez dira posible izaten eta laginketa metodo bereziak garatu behar dira (harrapatutako banakoak markatuz eta horien ondorengo jarraipena eginez, esaterako).<ref>{{en}} [http://biostat.ucdavis.edu/pages/about/about.html Graduate Group in Biostatistics], ''University of California'', 2012-02-20an kontsultatua.</ref>.
 
[[Bioestatistika]]k [[biologia]]n (eta inguruko arlo aplikatuetan, [[agronomia]]n kasu) sarri burutzen diren saiakuntza-diseinu bereziak aztertzen ditu, zoriaren eta faktoreen eraginak kontrolatuz. Orobat, [[genetika]]n herentzia aztertzeko adibidez, probabilitate-eredu bereziak garatu behar ditu, ondoren jasoko diren datuekin alderatzeko. Organismo nahiz populazioetarako eratzen diren hazkunde-ereduak datuekin kontrastatu behar dira. Populazioen dinamika (adinak, biziraupena, ...) ere estatistikatik, zehatzago [[demografia]]tik, hartutako tresnen bitartez aztertzen da. Demografian ez bezala, ordea, zentsuak ez dira posible izaten eta laginketa metodo bereziak garatu behar dira (harrapatutako banakoak markatuz eta horien ondorengo jarraipena eginez, esaterako)<ref>{{en}} [http://biostat.ucdavis.edu/pages/about/about.html Graduate Group in Biostatistics], ''University of California'', 2012-02-20an kontsultatua.</ref>.
 
=== Geoestatistika ===
180 ⟶ 167 lerroa:
 
=== Astroestatistika ===
Aitzinean, behaketa astronomikoetan gertatzen ziren erroreak [[batezbesteko]]ak eta beste zentro-neurriak erabiliz kontrolatzen ziren. Egun, astroestatistikak [[teleskopio]] eta beste behaketa-gailuek sortzen dituzten datu-multzo itzelak aztertzeko teknikak, [[datu-meatzaritza]]ren baitan esaterako, baliatu behar ditu, unibertsoko objektuak fidagarritasunez aurkitu eta behar bezala sailkatzeko; orobat, estatistikaren altzotik asmatu diren irudien analisirako tresnak ere baliatu behar ditu.<ref>{{en}} {{Erreferentzia
 
|hizkuntza=en
Aitzinean, behaketa astronomikoetan gertatzen ziren erroreak [[batezbesteko]]ak eta beste zentro-neurriak erabiliz kontrolatzen ziren. Egun, astroestatistikak [[teleskopio]] eta beste behaketa-gailuek sortzen dituzten datu-multzo itzelak aztertzeko teknikak, [[datu-meatzaritza]]ren baitan esaterako, baliatu behar ditu, unibertsoko objektuak fidagarritasunez aurkitu eta behar bezala sailkatzeko; orobat, estatistikaren altzotik asmatu diren irudien analisirako tresnak ere baliatu behar ditu<ref>{{en}} {{Erreferentzia
|izena1=Peter
|abizena1=Freeman
190 ⟶ 177 lerroa:
|izenburua=Astrostatistics: The Final Frontier
|egunkaria=Chance
|url=http://www.stat.cmu.edu/~annlee/Astrostatistics.pdf}}.</ref>.
 
=== Merkatu-ikerketa ===
 
[[Merkatu ikerketa|Merkatu-ikerketan]] kontsumitzaileek profilak osatu eta lehiakideen analisia egiten da. Horretarako, [[inkesta]] bidez eta behaketa zuzenaz jasotzen diren datuak aztertzen dira, produktuen eta kontsumitzaileen arteko ezberdintasunak azalerazteko.
 
== Estatistika ofiziala ==
Estatistikaren zeregina ere bada [[estatu]] bateko informazio ekonomiko, administratibo, [[demografia|demografiko]] eta [[ingurumen]]ari buruzkoa, ''estatistikak'' alegia, jaso eta hedatzea. Horretarako, gobernuek [[estatistika ofizial|estatistika-erakunde ofizialak]] kudeatzen dituzte, udal eta beste gobernu erakundeek ere euren estatistika-datuak plazaratzen dituzten arren. Nazioarteko erakundeek ere estatistiken hornitzaile nabarmenak dira. Informazio horren hartzaileak hiritarrak, euren informazio-eskubidea bermatuz, enpresak eta beste erakundeak, erabakiak hartzeko oinarri moduan, eta ikertzaileak dira. Historian zehar, [[zentsu (estatistika)|zentsuak]] eta [[errolda]]k izan dira informazio hori biltzeko tresnak; egun [[laginketa]]ren bitartez herri, eskualde nahiz herrialde bateko informazio fidagarria osatzen da. Horretaz gainera, estatistika ofizialaren jarduerak zenbait printzipio jarraitu behar ditu, hala nola pertsonen datuen [[konfidentzialtasun]]a atxikitzea; herrialde ezberdinetako alderagarriak izan daitezen, datuak nazioartean adostutako irizpide komunei jarraiki bildu eta plazaratzea eta datu bilketa eta estatistiken eraketa onartutako irizpide zientifikoetan oinarrituta burutzea, edonolako manipulazio politiko baztertuz.<ref>{{en}} [http://unstats.un.org/unsd/methods/statorg/FP-English.htm Fundamental Principles of Official Statistics], ''United Nations Statistics Division'', 2012-02-21ean kontsultatua.</ref>.
 
Estatistikaren zeregina ere bada [[estatu]] bateko informazio ekonomiko, administratibo, [[demografia|demografiko]] eta [[ingurumen]]ari buruzkoa, ''estatistikak'' alegia, jaso eta hedatzea. Horretarako, gobernuek [[estatistika ofizial|estatistika-erakunde ofizialak]] kudeatzen dituzte, udal eta beste gobernu erakundeek ere euren estatistika-datuak plazaratzen dituzten arren. Nazioarteko erakundeek ere estatistiken hornitzaile nabarmenak dira. Informazio horren hartzaileak hiritarrak, euren informazio-eskubidea bermatuz, enpresak eta beste erakundeak, erabakiak hartzeko oinarri moduan, eta ikertzaileak dira. Historian zehar, [[zentsu (estatistika)|zentsuak]] eta [[errolda]]k izan dira informazio hori biltzeko tresnak; egun [[laginketa]]ren bitartez herri, eskualde nahiz herrialde bateko informazio fidagarria osatzen da. Horretaz gainera, estatistika ofizialaren jarduerak zenbait printzipio jarraitu behar ditu, hala nola pertsonen datuen [[konfidentzialtasun]]a atxikitzea; herrialde ezberdinetako alderagarriak izan daitezen, datuak nazioartean adostutako irizpide komunei jarraiki bildu eta plazaratzea eta datu bilketa eta estatistiken eraketa onartutako irizpide zientifikoetan oinarrituta burutzea, edonolako manipulazio politiko baztertuz<ref>{{en}} [http://unstats.un.org/unsd/methods/statorg/FP-English.htm Fundamental Principles of Official Statistics], ''United Nations Statistics Division'', 2012-02-21ean kontsultatua.</ref>.
 
Estatistika ofizialek honako hauek hartzen dituzte, besteak beste, bere baitan: biztanleria datuak (herri, sexu eta adinaren arabera), bizi-itxaropenak, [[Barne produktu gordin|BPG]] hazkundea, [[langabezia]]ri buruzko datuak, ekoizpen eta prezioen bilakaerari buruzko datuak ([[Kontsumorako Prezioen Indizea]], kasu) sektore ekonomikoaren eta produktu motaren arabera, enpresa-kopuruak eta horien tamaina sektorearen arabera, osasun arloko estatistikak (heriotza-adinak, gaixotasunen prebalentzia) eta hezkuntzari buruzko datuak (maila eta ikastegi-motaren arabera).
 
:::::::::::'''=== Estatistika erakunde ofizial zenbait''' ===
 
{{Col-begin|width=80%}}
{{Col-break|width=20%}}
''';Euskal Herrian eta Europan'''
* [[Eurostat]], [[Europar BatasunaBatasun]]nean;
* [[Eustat]], [[Euskal Autonomia Erkidegoa]]n;
* [[Nafarroako Estatistika Institutua]], [[Nafarroako Foru Erkidegoa]]n;
* [[Instituto de Estadística de Navarra]], [[Nafarroa]]n;
* [[Espainiako Estatistika Institutua]] (INE), [[Espainia]]n;
* [[INSEE]], ''Institut National de la Statistique et des Études Économiques'', [[Frantzia]]n;
* ''[[Statistisches Bundesamt]]'', labur ''Destatis'', [[Alemania]]n;
* ''[[Office for National Statistics]]'', [[Erresuma Batua]]n.
{{Col-break|width=20%}}
''';Mundu zabalean'''
* ''[http://unstats.un.org/unsd/default.htm United Nations Statistics Division]'', [[Nazio Batuen Erakundea|Nazio Batuen]] estatistika erakundea;
* [[Ameriketako Estatu Batuetako Zentsu Bulegoa]], [[Ameriketako Estatu Batuak|Estatu Batuetan]];
* [[Txinako Estatistika Bulego Nagusia]], [[Txinako Herri Errepublika|Txinan]];
* ''[[Goskomstat]]'', [[Errusia]]n;
* ''[[Instituto Brasileiro de Geografia e Estatística]]'', IBGE, [[Brasil]]en;
* ''[[Indian Statistical Institute]]'', [[India]]n;
* ''[[Instituto Nacional de Estadística y Censos]]'', INDEC, [[Argentina]]n.
{{Col-break}}
{{Col-end}}
 
== Estatistika hezkuntza eta ikerkuntza ==
Estatistika baliatzen den arloen aniztasuna eta hedabideetan izaten duen presentzia trinkoa direla eta, garrantzitsutzat jotzen da haur eta gazteei oinarrizko probabilitate eta estatistika kontzeptuak erakustea. Gehienetan, estatistikari buruzko hezkuntza-edukiak matematika irakasgaiaren baitan integratu dira: batzuen ustez, ordea, estatistika arlo bakoitzaren baitan, tresna moduan eta testuinguru jakin batean, landu beharko litzateke. Bi helbururekin osa daiteke, gainera, estatistikaren [[curriculum (hezkuntza)|curriculuma]]: estatistikaren tresnak baliatzea eta estatistikak eskaintzen duen informazioa modu egokian interpretatu ahal izatea.<ref>{{en}} {{Erreferentzia
 
|hizkuntza=en
Estatistika baliatzen den arloen aniztasuna eta hedabideetan izaten duen presentzia trinkoa direla eta, garrantzitsutzat jotzen da haur eta gazteei oinarrizko probabilitate eta estatistika kontzeptuak erakustea. Gehienetan, estatistikari buruzko hezkuntza-edukiak matematika irakasgaiaren baitan integratu dira: batzuen ustez, ordea, estatistika arlo bakoitzaren baitan, tresna moduan eta testuinguru jakin batean, landu beharko litzateke. Bi helbururekin osa daiteke, gainera, estatistikaren [[curriculum (hezkuntza)|curriculuma]]: estatistikaren tresnak baliatzea eta estatistikak eskaintzen duen informazioa modu egokian interpretatu ahal izatea<ref>{{en}} {{Erreferentzia
|izena1=I.
|abizena1=Gal
235 ⟶ 219 lerroa:
|izenburua=The Assessment Challenge in Statistics Education
|orrialdeak=1-13
|url=http://books.google.es/books?id=xxdJgnFzNRsC&printsec=frontcover&hl=es&source=gbs_ge_summary_r&cad=0#v=onepage&q&f=false}}</ref>. Nolanahi ere, estatistika eduki gehienak [[bigarren hezkuntza]]n irakasten dira eta datuen taularaketak eta adierazpide grafikoak, batezbestekoaren kalkulua eta probabilitateen kalkulu sinplea biltzen dituzte.
 
Aurrerago, [[unibertsitate]]ko zientzia gradu guztietan jasotzen da estatistika irakasgai moduan; tresna estatistiko orokorrez gainera, arlo bakoitzeko aplikaziorako teknika bereziak ere irakasten dira. Ildo horretatik, unibertsitateetan estatistikaren irakaskuntzak duen aplikaziorako alborapena (probabilitate-teoria baztertuz, besteak beste) kritikatu egin da, gerora ikerketak egingo dituzten pertsonek metodo estatistikoaren oinarriak baztertuta aplikazio okerrak egingo dituztelakoan.<ref>{{en}} {{Erreferentzia
|hizkuntza=en
|izena=H.
|abizena=Hotelling
|izenburua=The Place of Statistics in the University
|url=http://projecteuclid.org/DPubS/Repository/1.0/Disseminate?view=body&id=pdf_1&handle=euclid.ss/1177013002
|urtea=1949}}.</ref>. Aldi berean, estatistikako gradu bereziak ere badaude unibertsitate askotan, estatistikariak prestatzeko, non estatistikaren oinarri matematiko eta aplikazioez gainera, datuen tratamendurako [[informatika]], [[matematika]] eta estatistikaren osagarriak diren beste arloak ere biltzen diren.
 
Badira estatistikaren erabiltzaileak nahiz ikertzaileak biltzen dituzten hainbat erakunde. Nazioartean, erakunde zabalena ''[http://www.isi-web.org/ International Statistical Institute]'' (ISI) delakoa da, XIX. mendean sortu eta gehienbat izaera profesionala duena; bere baitan estatistika erakunde berezituagoak hartzen ditu, besteak beste ingurumen, informatika, industria eta administrazio gaietarako estatistikaz arduratzen direnak. ''[http://imstat.org/en/index.html Institute of Mathematical Statistics]'' izeneko erakundeak izaera akademikoa du eta hainbat aldizkari plazaratzen ditu estatistika gaietan. NazioBadira mailakoestatu eremuko estatistika erakundeak ere badaude, hala nola Ameriketako Estatu Batuetako ''[[American Statistical Association]]'' eta Erresuma Batuko ''[[Royal Statistical Society]]'' izenekoak.
 
== Kanpo loturak ==
257 ⟶ 242 lerroa:
 
=== Estatistika erakunde ofizialak ===
* {{eu}} [http://eu.eustat.eseus/ci_ci/indice.html#axzz1ngEcVuOj Eustat], Euskal Autonomia Erkidegoko estatistika-erakunde ofiziala.
* {{es}} [http://www.cfnavarranavarra.es/estadisticahome_es/Gobierno+de+Navarra/Organigrama/Los+departamentos/Economia+y+Hacienda/Organigrama/Estructura+Organica/ Instituto+Estadistica/ deNafarroako EstadísticaEstatistika de NavarraErakundea], Nafarroako Erkidegoko estatistika-erakunde ofiziala.
* {{es}} [http://www.ine.es/ Instituto Nacional de Estadística], Espainiako estatistika-erakunde ofiziala.
* {{fr}} [http://www.insee.fr/fr/ INSEE], Frantziako estatistika-erakunde ofiziala.
264 ⟶ 249 lerroa:
 
=== Datu estatistikoen bildumak ===
 
* {{en}} [http://www.statista.com/ Statista].