Osagai nagusien analisi: berrikuspenen arteko aldeak

Ezabatutako edukia Gehitutako edukia
→‎Kanpo loturak: kanpo loturen hizkuntza zehaztea
No edit summary
1. lerroa:
[[Aldagai anitzeko estatistika]]n, '''osagai nagusien analisia (ONA)''' edo ''Principal Components Analysis (PCA)'' elkarrekiko [[korrelazio]]aindependenteak eta ergodikoak dutenden aldagai multzo bat korrelaziorik gabekoedo ''osagai'' izenekomultzo aldagaibatetik kopurubariantzarik txikiagogabeko batezaldagai laburbiltzen duen teknikakopuru bat osatzea da,, hasierako aldagaienosagaien aldakortasuna, [[bariantza]]ren bitartez neurtzen dena, osagaietan ahalik etakorrelazioa gehienagerian murriztekouzteko helburuarekin. OsagaiHorretarako bakoitzakorrelazio aldagaimatrizea guztienhartu konbinazioeta linealbariantza bat izangominimotzen da, etapuntuek batezosagaietan eredituzten elkarrekikopuntuazioak korrelazioatera nabarmenaasmoz duteneta aldagaiekinhorrela izangoegitura dahobeto loturik. Zenbaitetan Konposatu Nagusien Analisia (KNA) izenez ezagutzen daikusteko.
 
Zehatzago: <math>O=\sigma^2(X'X)</math>, minimotu behar da, non o osagaiak diren.
 
Osagai bakoitza aldagai guztien konbinazio lineal bat izango da eta batez ere elkarrekiko bariantza nabarmena duten aldagaiekin izango da loturik. Zenbaitetan Konposatu Nagusien Analisia (KNA) izenez ezagutzen da.
 
== Jatorria ==
5 ⟶ 9 lerroa:
Datuen analisirako teknika hau [[Hotelling]]-i (1933) zor zaio, nahiz eta lehen aurrekariak [[Karl Pearson]]-en doitze ortogonaletan (1901) aurkitzen diren. Aplikazio arloaren arabera beste izen batzuekin ere ezagutzen da, esaterako: [[Karhunen-Loève transformatua (KLT)]] edo [[Hotelling transformatua]].
 
== ErabileraAdibideak ==
 
Erabilera bikoitza du; lehenik agerian ez dauden aldagaiak aurkitzen laguntzen du, eta gainera normalean koerlazionatuta dauden aldagaiak aldagai independente berrietan bihurtzen ditu. Orohar, psikologian, ekonomian, irudien prozesamenduan eta ingeniaritzan erabili izan da, datu kopuru handiak lantzerako orduan.
 
Adibidez, izarrei buurzkoburuzko aldagaia asko jasotzen badira (distira, masa, ...), osagai nagusien analisiak izarren tipologia bat osatzen lagunduko du, elkar loturik dauden aldagaiak osagaienbariantzaren bitartez azalduzlotuz. Osagaiak agertzen duten bariantza totalaren zatiari buruz ordenatuko dira: lehenbizi bariantza totalaren zati handiena azaltzen duen osagaia erauziko da, ondoren geratzen den bariantzatik zati handiena azaltzen duena, ... Horrela, osagai nagusien analisia aldagai multzo batean seinalea (osagaia eta azaltzen duen bariantza) eta zarata (azaldu gabeko bariantza) bereizteko ere erabiltzen da.
 
== Azalpena ==
[[Fitxategi:PCA of Haplogroup J using 37 STRs.png|thumb|Ysearch datubasetik hartutako 354 Y-chromosome haplotype erabiliz egindako Konposatu Nagusien Analisia]]
[[Transformazio ortogonal]] baten bidez, Osagai Nagusiak deituriko aldagai berriak kalkulatzen dira, zeinak aldagai orijinalen konbinazio linealak diren, bariantzari gabeko osagaien bitartez. Lehen osagai nagusiaknagusia datuen [[bariantza]]ren gehiengoaosoa azaldu behar du, eta bigarrenak honekikobariantza ortogonalahandiagoa izan behar du, lehenak bariantza txikiena zuenez, 0 hain zuzen, eta gainera ahalik eta bariantza gehien azaldu. Aldagai berri hauen balioari faktore deritzo, eta geometrikoki behaketa orijinalen Osagai Nagusien gaineko proiekzio bezala uler daiteke.
 
Faktore hauek aldagaien [[korrelazio]]z kalkulatzen dira eta faktore bakoitzak aldagai batekin duen korrelazioak biek amankomunean duten informazioa azaltzen du, korrelazio honi, pisua deitzen zaio. Hala ere, osagai nagusiak beraien artean independenteak izateko datu orijinalek aldagai anitzeko [[distribuzio normal]]a jarraitu behar dute.