Kurtosi
Estatistikan, kurtosia (grezierazko κυρτός, kyrtos edo kurtos, "gainezka egin", "nabarmendu") banaketa baten zorroztasun maila da. Batezbesteko eta bariantza berdina dituzten bi banaketa simetriko itxuraz ezberdinak izan daitezkeela eta, kurtosi ezaugarria aztertzen da. Itxuraz, kurtosi handia duen banaketa bat zorrotzagoa izango da bere batez bestekoaren inguruan; zehatzago muturretatik bariantzaren zati handiena hartzen duena izango da kurtosi handiena duena, zentroan kokatzen diren datuek dakarten bariantzaren aldean. Kurtosi handiko banakuntzek zentro zorrotza dute eta mutur luze eta astunagoak; kurtosi txikiagoko banakuntzek, berriz, zentro zapala eta mutur labur eta arinagoak dituzte[1]. Horrela, era grafiko batean, banaketa batean burua (zentroa), sorbaldak eta besoak bereizten direla, kurtosi handiko banakuntzetan maiztasuna sorbaldetatik beso eta buruetara mugitu dela adierazi izan da.
Kurtosiak banaketaren ezaugarri jakingarri bat azaltzeaz gainera, aplikazio interesgarriak ditu. Mutur eta muturreko datuen azterketan kontzeptu erabilgarria da. Aldi berean, estatistikan eredu gisa maiz erabiltzen den banaketa normalak kurtosi-maila jakina eta finkoa duenez, kurtosia datu-multzo baterako eredu normala egokia den baieztatu ahal izateko erabiltzen da.
Kurtosiaren lagin neurriak
aldatuPearsonen kurtosi-koefizientea
aldatuLagin edo datu multzoetarako ohiko kurtosi neurria honela definitzen da Karl Pearsonek asmatu zuen koefizientea, n lagin tamaina izanik eta datuetarako[2][3][4]:
- ,
non k mailako lagin-momentu zentrala den.
Frogatu denez, neurri honen arabera kurtosia batez bestekoaren inguruan desbideratze estandar bateko tarte batean dagoen sakabanatze moduan ulertzen da[5]. Aurreko neurri horretatik eratorrita eta kontuan harturik banaketa normalaren kurtosi-mailak, aurreko prozedura erabiliz, 3 dela egoera guztietan, aurreko neurria era honetan ere kalkulatzen da, kurtosi-soberakina izena erabiliz, interpretazioa normalizatzeko: .
Emaitzaren interpretaziorako banaketa normala hartzen da erreferentzia gisa, banaketa normalak 3 balioa hartzen baitu beti:
- kurtosi koefizienteak 0 balioa hartzen duenean, edo 0tik gertuko balio bat lagin errore bat onartzen bada, banaketa edo datu multzoa mesokurtikoa dela esaten da, maila kurtosi ertaina duela alegia;
- koefizienteak balio positiboa hartzen badu, banaketa leptokurtikoa dela esaten da, maila kurtosi altua duela, edo banaketa normala baino zorrotzagoa dela alegia;
- koefizienteak balio negatiboa hartzen badu, banaketa platikurtikoa dela esaten da, banaketa normala baino zapalagoa dela alegia.
Banakuntza U itxurakoa denean, kurtosi-gehiegizkoak -1.2 balioa baino txikiagoa da [6].
Kurtosi maila txikiena , datu guztiak batez bestekoaren inguruko desbideratze bateko tarte batean daudenean ( edo tartean kokatzen direnean, alegia) gertatzen dena. Egoera honetako adibidea txanpon baten jaurtiketak dira, non emaitza bakoitza (0 eta 1, adibidez) %50eko maiztasunez gertatzen diren: batez bestekoa 0.5 da eta desbideratze estandarra ere 0.5 eta, beraz, emaitza guztiak, 0 eta 1 alegia, 0.5±0.5 tartean daude.
Koefiziente honen eragozpena bere ez-jasankortasuna: muturreko datuek koefizientearen emaitza alde batera zein bestera eraman dezakete, interpretazioa aldaraziz. Abantaila gisa, datu guztiak kontuan hartzen dituela esan behar da.
Kalkulua datu bakanetarako
aldatuxi 1 (1-3)2=4 (1-3)4=16 3 (3-3)2=0 (3-3)4=0 3 (3-3)2=0 (3-3)4=0 3 (3-3)2=0 (3-3)4=0 5 (5-3)2=4 (5-3)4=16 15 8 32
Kurtosi-koefizientea 0 baino txikiagoa denez, datuek banaketa platikurtiko bat, banaketa normala baino banaketa zapalagoa, osatzen dutela ondorioztatu behar da [7].
Kurtosi-neurri jasankorrak
aldatuPearsoen kurtosi-koefizientearen alternatiba jasankor moduan, koefiziente alternatiboak proposatu dira. Moorsek (1988) [5][8] oktil edo 8-koantiletan oinarrituriko koefiziente hau proposatu zuen:
non O 8-koantilak eta P dagozkien pertzentilak diren.
Koefizienteak 1.23 balioa hartzen du banaketa normalerako eta 1 balioa banaketa uniformerako. Beraz, era normalizatuan honela kalkula daiteke koefizientea, Pearsonen koefizientearekin egiten denaren antzera:
Interpretazioari dagokionez, positiboa bada banaketa leptokurtikoa ondorioztatuko da, eta platikurtikoa negatiboa bada.
Kurtosiaren zenbatespena
aldatuDatuetarako arestian emandako kurtosirako estatistikoa zenbatesle alboratua da. Hori dela eta, populazio bateko kurtosia zenbatesteko ohiko zenbateslea hau da (populazio normaletarako ezik, alboratua ere badena, ordea):
Aplikazioak
aldatuNormaltasunerako frogak diren D'Agostinoren K-karratu froga eta Jarque-Bera froga kurtosian oinarritzen dira.
Erreferentziak
aldatu- ↑ Testuliburu zenbaitetan akats nabarmena dago: kurtosia zorroztasun hutsa dela adierazten dute, kurtosi handiko edo txikiko banakuntzetako muturren ezaugarriak aipatu ere egin gabe.
- ↑ Beraz, kurtosia 4. mailako momentu estandarra da.
- ↑ Bariantzaren karratuaz zatitzean, muturrek dakarten bariantzaren gehikuntzaren efektua ezabatu eta horrela kurtosiari bariantzarekin izan dezakeen erlazioa baztertzen da.
- ↑ Neurri hau adimentsionala, hots, unitaterik gabea da. Gainera, eskala-aldaketa eginez ez da aldatzen.
- ↑ a b (Ingelesez) Moors, J. J. A.. (1988). «A quantile alternative for kurtosis» The statistician (37): 25-32..
- ↑ -1.2 baita, hain zuzen, banaketa uniformeak hartzen duen kurtosi-gehiegizko balioa.
- ↑ Azken ondorio bat emateko, emaitzaren adierazgarritasuna aztertu behar da, balioa 0tik aski aldentzen den egiaztatu alegia.
- ↑ Kim, Tae-Hwam; White, Halbert. (2003). On More Robust Estimation of Skewness and Kurtosis: Simulation and Application to the S&P500 Index. ..