Sakabanatze (estatistika): berrikuspenen arteko aldeak

Ezabatutako edukia Gehitutako edukia
ongi jarri dut bi datuak ez zutelako ongi agertzen
horrela ongi agertzen da
1. lerroa:
[[File:Variance various.svg|thumb|300px|[[Batezbesteko]]a ez da nahikoa datu multzoak bereizteko: irudiko bi banakuntzek [[zentro-joera (estatistika)|zentro]] berdina badute ere, berdez marraztutakoa '''sakabanatze''' handiagoa du.]]
 
viva el punk
[[Estatistika]]n, '''sakabanatzea''' edo '''dispertsioa''' [[aldagai (argipena)|aldagai]] bakarreko [[datu-multzo|datu multzo]] edo [[probabilitate banaketa]] baten aldakortasun edo heterogeneotasuna aztertzen duen ezaugarria da. Adibidez, ''A:(1,4,7)'' eta ''B(3,6,5)'' datu multzoak harturik, ''A'' datu multzoa sakabanatuagoa dela esango da, tarte handiago batean zehar zabaldu eta datuak gehiago aldentzen direlako 6 balioa hartzen duen [[batezbesteko aritmetiko sinple|batezbestekotik]]. [[Probabilitate teoria]]n, ziurgabetasunaren neurri moduan erabiltzen da maiz.
 
Estatistikan gehien aztertzen den ezaugarri bat da, [[zentro-joera (estatistika)|zentralizazioarekin]] batera, datuen zentroa ez baita nahikoa izaten datu multzoak bereizteko. Zentroaren eta sakabanatzearen zenbatespenak, berriz, aski izaten dira egoera askotan datu-multzoak eta probabilitate-banaketak zehaztu eta finkatzeko, [[banaketa normal]]aren kasuan esaterako. Horretaz gainera, sakabanatze neurriak [[batezbesteko]] baten fidagarritasun edo adierazgarritasuna zehazteko, aldagaiak kontrolatzeko (adibidez, lantoki bateko ekoizpen-datuak ohiko mugetatik aldentzen ari ote diren aztertzeko), datu multzoak eta probabilitate banaketak alderatzeko eta beste neurri estatistiko batzuk eratzeko erabiltzen dira. [[Muturreko datu]]ak hauteman eta [[estandarizazio (estatistika)|estandarizazio]] izeneko eragiketaz datu multzo ezberdinetako datuak alderatzeko ere erabiltzen dira.
 
Gehienetan, sakabanatzea [[aldagai kuantitatibo]]ei buruzkoa da, baina aldagai kualitatiboen sakabanatzea ere azter daiteke, beste ikuspuntu batetik bada ere. Nolanahi ere, sakabanatzea kontzeptu abstraktua da, hedapena, zabalera, aldakortasun eta desbideratze moduan interpretatzen dena. Horregatik, anitz dira sakabanatzea neurtzeko proposatu diren neurriak. Bi sailetan banatzen dira: sakabanatze neurri absolutuak, datu multzo eta probabilitate banaketa bakar baten aldakortasuna neurtzeko baliatzen direnak, eta sakabanatze neurri erlatiboak, bi datu multzo alderatzeko erabiltzeko egokiak.
 
== Sakabanatze neurriak: distantzia neurriak eta batezbesteko desbideratze neurriak ==
 
Sakabanatze neurri bat eratzeko bi modu daude funtsean:
 
* '''distantzia-neurri''' batean bi datu edo gehiagoren arteko distantzia edo aldea kalkulatzen da (adibidez, datu handiena ken datu txikiena);
* '''batezbesteko desbideratze-neurri''' batean, datu guztiak harturik, balio zehatz eta finko batera duten desbideratzeen batezbesteko bat kalkulatzen da.
 
Distantzia-neurrien abantaila nagusia kalkulurako erraztasuna da, baina eragozpen moduan ez dute jasotzen datu guztietan biltzen den informazioa. Batezbesteko desbideratze-neurri batean kontuan datu guztiak hartzen badira ere, kalkulua konplexuagoa da.
 
{{Col-begin|width=80%}}
{{Col-break|width=40%}}
'''Distantzia-neurriak'''
*[[Ibiltarte]]a
*[[Kuartil arteko ibiltarte]]a
*[[Dezil arteko ibiltarte]]a
{{Col-break|width=40%}}
'''Batez besteko desbideratze-neurriak'''
*[[Batez besteko desbideratze absolutu]]a
*[[Desbideratze absolutuen mediana]]
*[[Desbideratze estandar]]ra eta [[bariantza]]
*[[Batez besteko desbideratze absolutu]]a
*[[Desbideratze absolutuen mediana]]
*[[Batez besteko diferentzia]]
{{Col-break}}
{{Col-end}}
 
 
[[File:Ibiltarteak 01.png|thumb|center|400px|Datu-multzo baterako (datuak berdez agertzen dira, [[puntu diagrama]] bat osatuz) distantzian oinarritutako '''sakabanatze-neurri''' zenbait: [[ibiltarte]]ak datu txikienetik handienerako distantzia neurtzen du. [[Muturreko datu]]ek ibiltartean duten eragina saihesteko, [[kuartil arteko ibiltarte]]a (datuen %80aren ibiltartea) eta [[dezil arteko ibiltarte]]a erabil daitezke.]]
 
[[File:Desbideratze neurria 01.png|thumb|center|400px|'''Batez besteko desabideratzeko sakabanatze-neurriak''': ''(4,8,15)'' datuen [[batezbesteko aritmetiko sinple]]a 9, batezbestekorako desbideratzeak, ''(d=5,d=1,d=6)'' balio absolutuan, gorriz adierazten dira gezien bitartez; sakabanatze-neurri moduan, desbideratze hauen batezbesteko aritmetiko sinplea har daiteke: S=(5+1+6)/3=4.]]
 
== Sakabanatze neurri absolutuak eta erlatiboak ==
 
Sakabanatze neurri absolutuak eta erlatiboak ere bereizten dira. '''Sakabanatze neurri absolutuak''' datu multzo baten baitan dagoen aldakortasun maila absolutua neurtzen dute, aldagaiaren unitatetan. Sakabanatzea neurtzen duten jatorriko neurriak dira, distantzian eta batez besteko desbideratzean oinarritzen direnak. Ezin dira, ordea, erabili, datu multzo ezberdinetako sakabanatzeak alderatzeko, batezbesteko edo erreferentzia ezberdinei buruz kalkulatu direlako.
 
Oztopo hau gainditu eta horrela datu multzoen arteko sakabanatze-mailak alderatu ahal izateko '''sakabanatze-neurri erlatiboak''' erabiltzen dira, horretarako dimentsio edo unitaterik gabeko koefizienteak erabiliz eta sakabanatze-neurri absolutua dagokion zentro-neurriarekin alderatuz askotan (ikus, esaterako, ibiltarte-erdia eta desbideratze estandarra, hurrengo taulan). Adibidez, bariedade bateko tomate aleen pisuak jasotzen dituen datu-multzo baten baitan batezbesteko desbideratze-neurri bat 100 gramukoa bada, [[batezbesteko]]a 300 gramukoa izanik, eta beste bariedade batean desbideratze-neurria 100 gramukoa bada, baina 500 gramuko batezbesteko baten inguruan, bigarren kasuan sakabanatzea erlatiboki txikiagoa da: 100/300=%33.3koa lehen kasuan eta 100/500=%20koa bigarrenean. Konparazio erlatiboa datuak unitate ezberdinetan jasota dauden kasuetarako ere baliagarria da, sakabanatze-neurri erlatiboek ez baitute unitaterik, eta oro har [[ehuneko]] baten bitartez adieraz baitaitezke.
 
Sakabanatze-neurri absolutuak kasu bakar batean erabil daitezke bi datu-multzoen arteko sakabanatze-mailak alderatzeko: [[batezbesteko]] berdina eta unitate berdinetan dutenean.
 
 
:{| class="taulapolita"
! Neurri absolutua
! Formula
! Dagokion neurri erlatiboa
! Formula
|-
| rowspan=2 align="center" | [[Ibiltarte]]a
| rowspan=2 align="center" | <math>I=x_{max}-x_{min}</math>
| align="center" | [[Ibiltarte-koefiziente]]a
| align="center" | <math>\frac{x_{max}-x_{min}}{x_{max}+x_{min}}</math>
|-
| align="center" | [[Ibiltarte erlatibo]]a
| align="center" | <math>\frac{I}{\overline{x}}</math>
|-
| align="center" | [[Ibiltarte-erdi]]a
| align="center" | <math>\frac{x_{max}-x_{min}}{2}</math>
| align="center" | [[Ibiltarte-koefiziente]]a
| align="center" | <math>\frac{\frac{x_{max}-x_{min}}{2}}{\frac{x_{max}+x_{min}}{2}}=\frac{x_{max}-x_{min}}{x_{max}+x_{min}}</math>
|-
| align="center" | [[Kuartil arteko ibiltarte]]a
| align="center" | <math>IQR=Q_3-Q_1</math>
| align="center" | [[Kuartilen aldakortasun koefiziente]]a
| align="center" | <math>\frac{Q_3-Q_1}{Q_3+Q_1}</math>
|-
| align="center" | [[Kuartilen desbideratze]]a
| align="center" | <math>\frac{Q_3-Q_1}{2}</math>
| align="center" | [[Kuartilen aldakortasun koefiziente]]a
| align="center" | <math>\frac{\frac{Q_3-Q_1}{2}}{\frac{Q_3+Q_1}{2}}=\frac{Q_3-Q_1}{Q_3+Q_1}</math>
|-
| align="center" | [[Batez besteko desbideratze absolutu]]a
| align="center" | <math>D=\frac{1}{N} \sum_{i=1}^N|x_i - \overline{x}|\,</math>
| align="center" | Desbideratze absolutuaren koefizientea
| align="center" | <math>\frac{D}{\overline{x}}</math>
|-
| align="center" | [[Desbideratze estandar]]ra
| align="center" | <math>s_X = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}\,</math>
| align="center" | [[Aldakortasun-koefiziente]]a
| align="center" | <math>\frac{s_x}{\overline{x}}</math>
|-
| align="center" | [[Desbideratze absolutuen mediana]]
| align="center" | <math>
\operatorname{DAME} = \operatorname{Me}_i\left(\ \left| X_{i} - \operatorname{Me}(X_{j}) \right|\ \right) \,
</math>
| align="center" | Desbideratze absolutuen medianaren koefizientea
| align="center" | <math>\frac{DAME}{Me}</math>
|-
| align="center" | [[Batez besteko diferentzia]] (Gini)
| align="center" | <math>g=\frac{1}{n(n-1)}\sum_{i,j}|x_i-x_j|</math>
| align="center" |Batez besteko diferentzia erlatiboa
| align="center" | <math>\frac{g}{\overline{x}}</math>
|-
|}
 
== Kanpo loturak ==
 
{{commonskat}}
 
[[Kategoria:Sakabanatze eta desbideratze estatistikoa|*]]