Kalkulua datuetarako Aldatu
Honela adierazi eta kalkulatzen da, datuak
x
1
,
x
2
,
…
,
x
n
{\displaystyle x_{1},x_{2},\ldots ,x_{n}}
izanik:
s
X
2
=
1
N
∑
i
=
1
N
(
x
i
−
x
¯
)
2
{\displaystyle s_{X}^{2}={\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}\,}
Aurreko formulari jarraiki, pauso hauek jarraitu behar dira kalkulurako:
batezbesteko aritmetiko sinplea (
x
¯
{\displaystyle {\overline {x}}}
) kalkulatu;
x
i
−
x
¯
{\displaystyle x_{i}-{\overline {x}}}
, datu bakoitzak batezbestekora duen distantzia alegia, kalkulatu;
batuketa egitean konpentsa ez daitezen, distantzia karratuak kalkulatu;
distantzia karratu horien batezbestekoa kalkulatzen da, zati n datu kopurua eginez. Laburrago kalkulatzeko formula bat ere badago, aurreko formulatik erator daitekeena:
s
X
2
=
∑
i
=
1
n
x
i
2
n
−
x
¯
2
{\displaystyle s_{X}^{2}={\frac {\sum _{i=1}^{n}{x_{i}^{2}}}{n}}-{\overline {x}}^{2}\,}
Desbideratze estandarra bariantzaren erro karratu positiboa da:
s
X
=
1
N
∑
i
=
1
N
(
x
i
−
x
¯
)
2
=
∑
i
=
1
n
x
i
2
n
−
x
¯
2
{\displaystyle s_{X}={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}\,}}={\sqrt {{\frac {\sum _{i=1}^{n}{x_{i}^{2}}}{n}}-{\overline {x}}^{2}}}\,}
Adibidea datu bakanduetarako Aldatu
Kalkulurako adibide gisa, azterketa batean ikasle zenbaitek jasotako kalifikazio hauek hartuz (puntutan): 6-7-9-5-3.
Jatorrizko formula
Formula laburtua
x
i
{\displaystyle x_{i}\,}
(
x
i
−
x
¯
)
2
{\displaystyle (x_{i}-{\overline {x}})^{2}\,}
6
(6-6)2 =0
7
(7-6)2 =1
9
(9-6)2 =9
5
(5-6)2 =1
3
(3-6)2 =9
30
20
Lehendabizi, batezbesteko aritmetiko sinplea kalkulatzen da:
x
¯
=
∑
i
x
i
n
=
30
5
=
6
{\displaystyle {\overline {x}}={\frac {\sum _{i}x_{i}}{n}}={\frac {30}{5}}=6}
Jarraian,
s
x
2
=
∑
i
(
x
i
−
x
¯
)
2
n
=
20
5
=
4
→
s
X
=
4
=
2
{\displaystyle s_{x}^{2}={\frac {\sum _{i}(x_{i}-{\overline {x}})^{2}}{n}}={\frac {20}{5}}=4\rightarrow s_{X}={\sqrt {4}}=2}
Bariantza 4 puntu2 izango da, beraz. Desbidazio estandarra emaitza horren erro karratua da: 2 puntu.
x
i
{\displaystyle x_{i}\,}
x
i
2
{\displaystyle x_{i}^{2}\,}
6
62 =36
7
72 =49
9
92 =81
5
52 =25
3
32 =9
30
200
Lehendabizi, batezbesteko aritmetiko sinplea kalkulatzen da:
x
¯
=
∑
i
x
i
n
=
30
5
=
6
{\displaystyle {\overline {x}}={\frac {\sum _{i}x_{i}}{n}}={\frac {30}{5}}=6}
Jarraian,
s
x
2
=
∑
i
x
i
2
n
−
x
¯
2
=
200
5
−
6
2
=
4
→
s
X
=
4
=
2
{\displaystyle s_{x}^{2}={\frac {\sum _{i}x_{i}^{2}}{n}}-{\overline {x}}^{2}={\frac {200}{5}}-6^{2}=4\rightarrow s_{X}={\sqrt {4}}=2}
Arestiko emaitza berdinak eskuratzen dira, baina kalkuluak erosoago eginez.
Adibidea maiztasun-tauletatarako Aldatu
Datuak maiztasun-taula batean bildu direnean, maiztasun-taulatik bertatik egin daiteke kalkulua. Aiseago egiten da formula laburtuarekin, hurrengo adibidean egiten den bezala.
xi (balioak)
ni (maiztasunak)
ni xi
ni xi 2 5
2
10
50
6
3
18
108
8
1
64
64
baturak
6
36
670
s
x
2
=
∑
i
n
i
(
x
i
−
x
¯
)
2
∑
i
n
i
=
∑
i
n
i
x
i
2
∑
i
n
i
−
x
¯
2
=
222
6
−
(
36
6
)
2
=
1
{\displaystyle s_{x}^{2}={\frac {\sum _{i}n_{i}(x_{i}-{\overline {x}})^{2}}{\sum _{i}n_{i}}}={\frac {\sum _{i}n_{i}x_{i}^{2}}{\sum _{i}n_{i}}}-{\overline {x}}^{2}={\frac {222}{6}}-{\Bigg (}{\frac {36}{6}}{\Bigg )}^{2}=1}
Adibidea tartetan bildutako datuetarako Aldatu
Datuak tartetan bildu direnean, tarte horietako erdipuntuak hartzen dira kalkuluetarako balio adierazgarri moduan.
Tarteak
ni (maiztasunak)
xi (balioak)
ni xi
ni xi 2 0-40
5
20
100
2000
40-80
30
60
1800
108000
80-120
10
100
1000
100000
baturak
45
2900
210000
s
x
2
=
∑
i
n
i
(
x
i
−
x
¯
)
2
∑
i
n
i
=
∑
i
n
i
x
i
2
∑
i
n
i
−
x
¯
2
=
210000
45
−
(
2900
45
)
2
=
513.63
{\displaystyle s_{x}^{2}={\frac {\sum _{i}n_{i}(x_{i}-{\overline {x}})^{2}}{\sum _{i}n_{i}}}={\frac {\sum _{i}n_{i}x_{i}^{2}}{\sum _{i}n_{i}}}-{\overline {x}}^{2}={\frac {210000}{45}}-{\Bigg (}{\frac {2900}{45}}{\Bigg )}^{2}=513.63}
Tarte bakoitzean hartutako erdipuntuaren hurbilketak dakarren errorea zuzentzeko Shepparden zuzenketa delakoa erabiltzen da, datuak banaketa normalari jarraiki banatzen direnean eta tarte-zabalera konstantea denean soilik aplika daitekeena (b , tarte-zabalera):
s
~
X
2
=
s
X
2
−
b
2
12
=
513.63
−
40
2
12
=
380.3
{\displaystyle {\tilde {s}}_{X}^{2}=s_{X}^{2}-{\frac {b^{2}}{12}}=513.63-{\frac {40^{2}}{12}}=380.3}
Kalkulua probabilitate banakuntzetarako Aldatu
Honela definitzen da,
μ
=
E
[
X
]
{\displaystyle \mu =E[X]}
izanik itxaropen matematikoa :
var
[
X
]
=
σ
X
2
=
E
[
(
X
−
μ
)
2
]
{\displaystyle \operatorname {var} [X]=\sigma _{X}^{2}=E[(X-\mu )^{2}]}
Banakuntza jarraitua bada, honela kalkulatzen da, integralak X aldagaiaren balioen
Ω
(
X
)
{\displaystyle \Omega (X)}
eremuan ebaluatu behar direlarik:
var
[
X
]
=
σ
X
2
=
∫
Ω
(
X
)
(
x
−
μ
)
2
p
(
x
)
d
x
{\displaystyle \operatorname {var} [X]=\sigma _{X}^{2}=\int _{\Omega (X)}(x-\mu )^{2}\,p(x)\,dx\,}
, non
μ
=
∫
Ω
(
X
)
x
p
(
x
)
d
x
{\displaystyle \mu =\int _{\Omega (X)}x\,p(x)\,dx}
Banakuntza diskretua bada,
x
i
,
p
(
x
i
)
{\displaystyle x_{i},p(x_{i})}
aldagaiaren balio eta beren probabilitateak izanik:
var
(
X
)
=
σ
X
2
=
∑
i
p
i
(
x
i
−
μ
)
2
{\displaystyle \operatorname {var} (X)=\sigma _{X}^{2}=\sum _{i}p_{i}(x_{i}-\mu )^{2}\,}
, non
μ
=
∑
i
x
i
p
(
x
i
)
{\displaystyle \mu =\sum _{i}x_{i}\,p(x_{i})\,}
Definizioaren formula garatuz, jatorriari buruzko momentuetan oinarritutako adierazpen batera heltzen da, kalkulurako erosoagoa dena:
var
[
X
]
=
σ
X
2
=
E
[
(
X
−
μ
)
2
]
=
E
[
X
2
]
−
μ
2
=
E
[
X
2
]
−
E
[
X
]
2
{\displaystyle \operatorname {var} [X]=\sigma _{X}^{2}=E[(X-\mu )^{2}]=E[X^{2}]-\mu ^{2}=E[X^{2}]-E[X]^{2}}
Banakuntza diskretu baterako adibidea Aldatu
0 eta 1 balioak 0.4 eta 0.6 probabilitateaz hartzen dituen probabilitate-banaketaren bariantza kalkulatu behar da.
Jatorrizko formula
Formula laburtua
x
i
{\displaystyle x_{i}\,}
p
(
x
i
)
{\displaystyle p(x_{i})\,}
x
i
p
(
x
i
)
{\displaystyle x_{i}p(x_{i})\,}
(
x
i
−
μ
)
2
p
(
x
i
)
{\displaystyle (x_{i}-\mu )^{2}p(x_{i})\,}
0
0.4
0
0.144
1
0.6
0.6
0.096
baturak
1
μ
=
0.6
{\displaystyle \mu =0.6\,}
σ
2
=
0.24
{\displaystyle \sigma ^{2}=0.24\,}
Lehendabizi, itxaropen matematikoa kalkulatzen da, hirugarren zutabean egiten den bezala. Jarraian, bariantza kalkulatzeko, bere formula aplikatzen da zuzenean laugarren zutabean.
x
i
{\displaystyle x_{i}\,}
p
(
x
i
)
{\displaystyle p(x_{i})\,}
x
i
p
(
x
i
)
{\displaystyle x_{i}p(x_{i})\,}
x
i
2
p
(
x
i
)
{\displaystyle x_{i}^{2}p(x_{i})\,}
0
0.4
0
0
1
0.6
0.6
0.6
baturak
1
μ
=
0.6
{\displaystyle \mu =0.6\,}
E
[
X
2
]
=
0.6
{\displaystyle E[X^{2}]=0.6\,}
Itxaropen matematikoa hirugarren zutabean kalkulatzen da. Jarraian, laugarren zutabean,
E
[
X
2
]
{\displaystyle E[X^{2}]\,}
kalkulatzen da.
σ
2
=
E
[
X
2
]
−
E
[
X
]
2
=
0.6
−
0.6
2
=
0.24
{\displaystyle \sigma ^{2}=E[X^{2}]-E[X]^{2}=0.6-0.6^{2}=0.24}
Banakuntza jarraitu baterako adibidea Aldatu
f
X
(
x
)
=
2
x
;
0
<
x
<
1
{\displaystyle f_{X}(x)=2x;\ 0<x<1\,}
banaketaren bariantza kalkulatu behar da,
Jatorrizko formula
Formula laburtua
Lehendabizi, itxaropen matematikoa kalkulatzen da:
μ
=
E
[
X
]
=
∫
Ω
x
f
(
x
)
d
x
=
∫
0
1
x
2
x
d
x
=
0.66
{\displaystyle \mu =E[X]=\int _{\Omega }xf(x)dx=\int _{0}^{1}x2xdx=0.66}
Jarraian, bariantza kalkulatzeko:
σ
2
=
∫
Ω
(
x
−
μ
)
2
f
(
x
)
d
x
=
∫
0
1
(
x
−
0.66
)
2
⋅
2
x
d
x
=
0.055
{\displaystyle \sigma ^{2}=\int _{\Omega }(x-\mu )^{2}f(x)dx=\int _{0}^{1}(x-0.66)^{2}\cdot 2xdx=0.055}
Lehendabizi, itxaropen matematikoa kalkulatzen da:
μ
=
E
[
X
]
=
∫
Ω
x
f
(
x
)
d
x
=
∫
0
1
x
2
x
d
x
=
0.666
{\displaystyle \mu =E[X]=\int _{\Omega }xf(x)dx=\int _{0}^{1}x2xdx=0.666}
Jarraian,
E
[
X
2
]
{\displaystyle E[X^{2}]\,}
kalkulatzen da:
E
[
X
2
]
=
∫
Ω
(
x
)
2
f
(
x
)
d
x
=
∫
0
1
x
2
⋅
2
x
d
x
=
0.5
{\displaystyle E[X^{2}]=\int _{\Omega }(x)^{2}f(x)dx=\int _{0}^{1}x^{2}\cdot 2xdx=0.5}
Azkenik, bariantza honela kalkulatzen da
σ
2
=
E
[
X
2
]
−
E
[
X
]
2
=
0.5
−
0.666
2
=
0.055
{\displaystyle \sigma ^{2}=E[X^{2}]-E[X]^{2}=0.5-0.666^{2}=0.055}
Bariantzaren propietateak Aldatu
Bariantza beti da ez-negatiboa Aldatu
Bariantza ez da inongo kasutan negatiboa. 0 balioa ere har dezake, datu guztiak berdinak direnean nahiz 1 probabilitatea duen konstante baten kasuan.
Bigarren mailako momentu txikiena Aldatu
Bariantza bigarren mailako momentu txikiena da:
datuetarako,
∑
i
(
x
i
−
k
)
2
n
{\displaystyle {\frac {\sum _{i}(x_{i}-k)^{2}}{n}}}
adierazpena minimotzen duen
k
{\displaystyle k\,}
balioa
x
¯
{\displaystyle {\overline {x}}}
da;
probabilitate banakuntzetarako,
E
[
(
X
−
k
)
2
]
{\displaystyle E[(X-k)^{2}]}
minimiotzen duen
k
{\displaystyle k\,}
balioa
μ
{\displaystyle \mu }
da. Aldagai-aldaketa lineala Aldatu
Y
=
a
+
b
X
{\displaystyle Y=a+bX\,}
aldagai-aldaketa lineala egiten bada,
a
,
b
{\displaystyle a,\ b\,}
konstanteak izanik,
datuen bariantzari buruz,
s
Y
2
=
b
2
s
X
2
{\displaystyle s_{Y}^{2}=b^{2}s_{X}^{2}}
,
probabilitate-banakuntzen bariantzari buruz,
v
a
r
[
Y
]
=
b
2
v
a
r
[
X
]
{\displaystyle var[Y]=b^{2}var[X]}
Hau da, datu guztiei (edo zorizko aldagaiari) konstante bat gehitu edo kentzeagatik, bariantzaren emaitza ez da aldatzen, baina konstante batez bidertzean, bariantza bider konstante hori karratura bidertzen da.
Aldagaien baturaren bariantza Aldatu
X
1
,
X
2
,
…
,
X
n
{\displaystyle X_{1},X_{2},\ldots ,X_{n}}
aldagaiak elkarrekiko independenteak badira:
v
a
r
[
X
1
+
X
2
+
⋯
+
X
n
]
=
v
a
r
[
X
1
]
+
v
a
r
[
X
2
]
+
⋯
+
v
a
r
[
X
n
]
{\displaystyle var[X_{1}+X_{2}+\cdots +X_{n}]=var[X_{1}]+var[X_{2}]+\cdots +var[Xn]}
Aurreko berdintza aldagaiak elkarrekiko korrelazio linealik gabeak direnean ere betetzen da.
Oro har, independenteak ez badira, bariantzak eta aldagai-bikote guztien kobariantzak gehitu behar dira[1] :
v
a
r
[
X
1
+
X
2
+
⋯
+
X
n
]
=
∑
i
v
a
r
[
X
i
]
+
∑
i
∑
j
≠
i
c
o
v
[
X
i
,
X
j
]
=
∑
i
v
a
r
[
X
i
]
+
2
∑
i
∑
j
>
i
c
o
v
[
X
i
,
X
j
]
{\displaystyle var[X_{1}+X_{2}+\cdots +X_{n}]=\sum _{i}var[X_{i}]+\sum _{i}\sum _{j\neq i}cov[X_{i},X_{j}]=\sum _{i}var[X_{i}]+2\sum _{i}\sum _{j>i}cov[X_{i},X_{j}]}
Bi aldagaien kasurako, esate baterako:
v
a
r
[
X
1
+
X
2
]
=
v
a
r
[
X
1
]
+
v
a
r
[
X
2
]
+
2
c
o
v
[
X
1
,
X
2
]
{\displaystyle var[X_{1}+X_{2}]=var[X_{1}]+var[X_{2}]+2cov[X_{1},X_{2}]}
Bariantza bi aldagai berdinen arteko kobariantza da Aldatu
Bariantza kobariantza berezi bat besterik ez da, non kobariantzan parte hartzen duten bi aldagaiak berdinak diren:
v
a
r
[
X
]
=
c
o
v
[
X
,
X
]
{\displaystyle var[X]=cov[X,X]}
Erreferentziak Aldatu
Kanpo lotutak Aldatu
Kanpo estekak Aldatu