14:01, 10 abendua 2018ko berrikusketa aldatu Anazj (eztabaida \| ekarpenak) 1.476 edits No edit summary ← Aurreko ezberdintasuna		16:41, 10 abendua 2018ko berrikusketa aldatu desegin Anazj (eztabaida \| ekarpenak) 1.476 edits No edit summary Hurrengo ezberdintasuna →
12. lerroa: == Definizio formala == Demagun [[zorizko aldagai]] baten hasierako indeterminazio maila <math>k</math> dela (<math>k</math> egoera posible dituela, alegia). Demagun, gainera, egoera guztiak probabilitate berekoak direla. Hori hala izanik, konbinazio jakin bat gertatzeko probabilitatea <math>p=1/k</math> izango da. Beraz, honakoa idatz daiteke:<ref group="oh">Ikusi daitekeenez, 2 oinarria duen logaritmoa erabiltzen da informazioa kode bitarrean adieraziko dela kontsideratzen delako. Informazioa adierazteko <math>a</math> oinarria duten balioak erabiltzekotan, <math>a</math> oinarria duen logaritmoa erabiltzea egokia izango litzateke.</ref> <math>\log_2(k)= \log_2[1/(1/k)]= \log_2(1/p) = \underbrace{\log_2(1)}_{= 0}-\log_2(p) =- \log_2(p)</math> Egoera guztiak probabilitate berekoak ez badira, hau da, <math>i.</math> egoera <math>p_i</math> probabilitatez gertatzen bada, informazio-kantitateen batuketa haztatuaren bidez kalkulatuko da entropia:<ref>Cuevas Agustín, Gonzalo, "Teoría de la información, codificación y lenguajes", Ed. SEPA (Sociedad para Estudios Pedagógicos Argentinos), Serie Informática 1986</ref><ref group="oh">Kontuan izan ~~kantitate~~unitaterik ~~adimentsionalak~~gabeko kantitateak direla~~, hau da, ez dute unitaterik~~.<br /></ref> <math>H=-p_1 \log_2(p_1)-p_2 \log_2(p_2)-....-p_k \log_2(p_k)=- \sum_{i=1}^{k}p_i \log_2(p_i)</math> 27. lerroa: === Adibidea === Har dezagun txanpon baten jaurtiketaren adibidea. Txanpona jaurtitzean aurpegia ala gurutzea lortzen dira; txanpona zintzoa bada, bi egoerek probabilitate bera dute. ~~Demagun~~eta ~~txanpona~~beraz, ezjaurtiketaren ~~dela~~emaitzaren ~~zintzoa~~entropia maximoa da. ~~Kasu~~Ziurgabetasun maximoko egoera ~~horretan~~da, ~~[[Bernoulli~~hurrengo ~~prozesu\|Bernoulli~~jaurtiketaren ~~prozesu]]~~emaitza ~~baten~~aurreikustea ~~moduan~~ia ~~ikus~~ezinezkoa ~~daiteke~~delako. [[Fitxategi:Binary entropy plot.svg\|thumb\|Xren entropia [[Bernoulli saiakuntza\|Bernoulli-ren saiakuntzan]]. (Xak 0 edo 1 balioak har ditzakeen ausazko saiakuntza). Entropia P(X=1) probabilitatearen araberakoa da. P(X=1)=0,5 denean, emaitza guztiek probabilitate bera dute, beraz, ziurgabetasun-maila altua da eta entropia maximoa.]] Jaurtiketaren emaitzaren entropia maximizatuko da txanpon zintzoa bada, hau da, probabilitate bera badago aurpegia edo gurutzea lortzeko (P = 0,5). Egoera hau ziurgabetasun maximoko egoera da, hurrengo jaurtiketaren emaitza aurreikustea ia ezinezkoa da eta. <math>\begin{align} \Eta(X) &= -\sum_{i=1}^n {\mathrm{Pp}(x_i) \~~log_b~~log_2 \mathrm{Pp}(x_i)} \\ &= -\sum_{i=1}^2 {\frac{1}{2}\log_2{\frac{1}{2}}} \\ &= -\sum_{i=1}^2 {\frac{1}{2} \cdot (-1)} = 1 \end{align}</math> ~~Bestetik,~~Baina ~~hartu dezagun zintzoa~~txanpona ez ~~den~~bada ~~txanpona~~zintzoa, ~~izan~~hau ~~ere~~da, aurpegia lortzeko probabilitatea (p da) eta gurutzea lortzekoa, ~~ordez~~(q) desberdinak badira, q(p≠q), ~~non~~orduan ~~p≠q~~[[Bernoulli prozesu\|Bernoulli-ren prozesu]] baten bidez eredutu ahal izango dugu. ~~Egoera~~Kasu ~~honetan~~horretan, ziurgabetasuna txikiagoa da., ~~Jaurtitzen~~txanpona jaurtitzen den ~~bakoitzean,~~aldiero txanponaren alde bat lortzearen probabilitatea bestea lortzearena baino handiagoa ~~izango da~~delako. Ziurgabetasuna murriztean, entropia ere murrizten da. Adibidez, p=0,7 denean: <math>\begin{align} 50 ⟶ 48 lerroa: === Elkarrekiko informazioa === Entropia [[Elkarrekiko informazio\|elkarrekiko informazioaren]] kasu berezi bat bezala uler daiteke. Zorizko bi ~~balioen~~aldagairen ~~[[Elkarrekiko informazio\|~~elkarrekiko informazioa~~]],~~ I(X, Y) ~~bezala~~notazioaz ~~adierazia,~~adierazten da eta bi aldagaien elkarrekiko ~~dependentzia~~mendekotasuna neurtzen ~~duen [[Kantitate\|kantitatea]] da~~du. [[Zorizko ~~aldagai]] bat ezagutzean, demagun~~ Y ~~dela~~aldagai<ref>Dan C. Marinescu, Gabriela M. Marinescu, "Classical and Quantum Information",Academic Press 2012</ref>, baten balioa ezagutzeak X [[Aldagai (matematika)\|aldagaiaren]] ziurgabetasun maila (edo '''entropia''') zenbat murrizten ~~den~~duen neurtzen du ~~informazio kantitateak~~. Beraz, ~~honako hau~~zera ondoriozta ~~dezakegu~~daiteke: X eta Y berdinak badira, orduan I(X; X) = H(X) betetzen da. == Propietateak == Entropiak ~~hurrengo~~honako propietateak ~~dauzka~~betetzen ditu: # ~~Ezin~~Ez da negatiboa ~~izan~~. '''''<math>p_i</math>'''''probabilitate bat ~~izanda~~denez, <math>0 < p_i \le 1</math> ~~beteko~~betetzen da. Hortaz, <math>\log_2p_i \le 0</math> eta ondorioz <math>-\log_2 p_i \ge 0</math> betetzen dela ziurta daiteke. # <math>H \le \log_a (n)</math>. Hau da, H entropiak goi -bornea ~~dauka~~du (maximoa denean) eta ez du informazio-~~galera~~galerarik suposatzen. # Izan ~~bedi~~bitez {A1, …, An} emaitza posibleak eta p1, …, pn ~~probabilitate erlatiboak~~probabilitateak dituen prozesu bat. <math>H(p_1,\dots, p_n)\,</math> funtzioa maximoa da ~~hurrengo egoera ematen bada:~~ <math>p_1 = \dots = p_n = 1/n\,</math>. ~~Emaitza~~betetzen ~~intuitiboa~~denean; daemaitza ~~mezuaren~~guztiak ~~ziurgabetasun~~probabilitate ~~maximoa~~berberaz ~~daukagulako~~gerta ~~aldagaiaren~~daitezkeenean ~~balio~~ematen ~~posibleak~~da ~~ekiprobableak~~ziurgabetasunaren ~~direnean~~maila maximoa. # Izan ~~bedi~~bitez {A1, …, An} emaitza posibleak eta p1, …, pn ~~probabilitate erlatiboak~~probabilitateak dituen prozesu bat. <math>H(p_1,\dots, p_n)\,</math>funtzioak 0 balioa du <math>p_i = 0</math> bada i-ren edozein baliorako klase jakin baterako izan ezik, non <math>p_j = 0</math>. Modu intuitiboan pentsa daiteke egoera batek edo gehiagok probabilitate altua dutenean entropia nabarmenki jaisten dela, ~~jasoko den mezuari buruzko ziurgabetasun txikiagoa~~ziurgabetasuna ~~existitzen~~txikitzen delako. == Kodetzaile optimoa == '''Kodetzaile ~~optimo~~optimoa''' ~~bat~~ mezu bat kodetzeko bit kopuru minimoa erabiltzen duena da. Kodetzaile optimo batek kode laburrak erabiliko ditu ~~maiztasunez~~maiztasun handiz agertzen diren mezuak kodetzeko eta gutxitan agertzen diren ~~mezuen kasuan~~mezuetarako kode ~~luzeagoez~~luzeagoak ~~baliatuko~~erabiliko dadira. ~~Modu honetan~~Horrela, memoria gunearen errendimendua optimizatzen da eta sistema eraginkorra da, mezua adierazteko behar den bit kopuruari dagokionez. Adibidez, [[Morse kodea]] kodetzaile optimo bat ez izan arren, printzipio ~~honetaz~~horretan ~~aprobetxatzen~~oinarritzen da, ingelesez maiztasun ~~handiagoarekin~~handiagoz agertzen diren hizkiei kode laburragoak esleituz. Beste ~~eredu~~adibide bat [[Huffmanen algoritmoa]] ~~izango litzateke~~da<ref>Huffman, D., "A method for the Construction of Minimum-Redundancy Codes", Proc. IRE, Vol 40 1952</ref>. Algoritmo ~~honek~~horrek informazioa trinkotzen du '''kodetzaile optimoan''' oinarrituz. Lehenik ~~eta behin~~, ~~informazioa zeharkatzen du~~ karaktereen agerpen-maiztasuna ~~aurkituz.~~kalkulatzen ~~Maiztasuna aurkiturik~~du, ondoren kodetzaile optimoa bilatzen du [[zuhaitz bitarren]] bidez. ~~Trinkotze~~[[Datu-konpresio]] teknika ~~batzuek~~batzuk ezsinboloen ~~dituzte~~probabilitateak kalkulatu ordez sinbolo ~~bakaneko~~-sekuentzien probabilitateak ~~erabiltzen~~kalkulatzen ~~mezua kodetzeko~~dituzte, ~~baizik eta sinbolo sekuentzien probabilitate bateratua;~~datuen ~~ulermen~~konpresio maila altuagoa ~~lortuz~~lortzeko. Kodetzaile optimo bat ~~eratu~~eraiki ~~dezakegu~~daiteke X zorizko aldagai baten entropian oinarrituz. ~~Entropiaren~~Logaritmoa ~~bidez~~oinarri ~~kodetzaile~~bitarrean ~~optimo~~erabiltzen ~~batekin~~bada, mezu bat kodetzeko ~~beharrezko~~behar den '''~~biten~~bit kopuruaren batezbestekoa''' ~~lor~~lortzen ~~dezakegu~~da. Horrela, ~~oinarri~~Shannon-ek ~~bitarreko~~analitikoki ~~logaritmoa~~frogatu ~~erabiltzen badugu. Beraz~~zuenez, mezu ~~bat~~baten konpresioa sinboloak banaka hartuz eta informazio galerarik gabe ~~konprimitu~~zenbat konprima daitekeen ~~muga maximoa lortu dezakegu~~kalkula ~~horrela~~daiteke (~~Shannon-ek~~muga ~~analitikoki frogatua~~maximoa). ~~Ulermen~~Konpresioaren muga (bitetan neurtua), ~~entropia~~entropiaren ~~bider~~eta mezuaren ~~luzera~~luzeraren biderkadura izango da. <math>H(X) = -\sum_{i}p(x_i) \log_2 p(x_i) = \sum_{i}-p(x_i)\log_2p(x_i) = </math> <math>=\sum_{i}p(x_i)[log_2(1)-\log_2(p(x_i))] = \sum_{x}p(x) \log_2(1/p(x))</math> Beraz, <math>X</math> zorizko aldagai diskretu baten <math>x_i</math> ~~edo~~ sinbolo espezifiko batek ematen duen informazioa, (bitetan ~~definiturik)~~neurtua, ~~hurrengo formula bezala~~horrela definitzen da: <math>I(x_i) = \log_2{\frac{1}{p(x_i)}}=-\log_2{p(x_i)}</math> === Adibidea === Demagun mezu batek hiru egora izan ~~ahal dituela~~ditzakeela. M1 egoeraren probabilitatea %50-ekoa da, M2 egoeraren probabilitatea %25-ekoa da eta M3 egoerarena %25-ekoa. M1-erako <math>\log_2 [1/p(M_1)]=\log_2 2= 1</math> lortuko dugu. 84 ⟶ 83 lerroa: M3-erako <math>\log_2 [1/p(M_2)]=\log_2 4= 2</math> lortuko dugu. Beraz, kodetzaile optimoak bit bat erabiliko du M1 transmititzeko, eta ~~aldiz~~ bi bit ~~behar~~beharko ~~izango ditugu~~dira M2 eta M3 ~~egoeretarako~~kodetzeko. Adibidez, M1 =kodetzeko "0" erabil dezakegu, M2 =kodetzeko 10 eta ~~M3 =~~M3rako 11 ~~erabili dezakegu mezua kodetzeko~~, adibidez. ~~Hitzarmen~~Hala egingo ~~honekin~~bagenu, M<sub>1</sub>M<sub>2</sub>M<sub>1</sub>M<sub>1</sub>M<sub>3</sub>M<sub>1</sub>M<sub>2</sub>M<sub>3</sub> mezua “010001101011” ~~bezala~~moduan kodetuko genuke, 12 bit erabiliz. Entropiaren balioa honakoa izango litzateke: <math>H(X)= 1/2 \log_2(2)+1/4 \log_2(4) + 1/4 \log_2(4)=1,5</math> ~~Beraz,~~Zera ondoriozta ~~dezakegu,~~daiteke: kodetzaile optimoak 1,5 bit ~~behar~~beharko ~~izango dituela~~ditu Xren edozein ~~baliorako~~balio kodetzeko. == ~~Baldintzapeko~~Baldintzazko entropia ==▼ : ''Ikus'' [[Baldintzazko entropia]] ~~Hartu~~Izan ~~ditzagun bi aldagai,~~bitez X eta Y, haien artean independenteak ez ~~direnak,~~diren ~~hau~~bi ~~da,~~aldagai; horietako bat ezagutzeak (Y, adibidez) besteari buruzko informazioa (XXri ~~adibidez~~buruzkoa) ematen digu. Informazioaren entropiari ~~begira~~dagokionez, Y aldagaiaren informazioak X aldagaiaren ziurgabetasuna txikituko duela esan dezakegu. Beraz, X aldagaiaren entropia Y aldagaiaren menpe ~~egongo dela~~dagoela esan ~~dezakegu~~daiteke:▼ ▲== Baldintzapeko entropia == ▲Hartu ditzagun bi aldagai, X eta Y, haien artean independenteak ez direnak, hau da, bat ezagutzeak (Y adibidez) besteari buruzko informazioa (X adibidez) ematen digu. Informazioaren entropiari begira, Y aldagaiaren informazioak X aldagaiaren ziurgabetasuna txikituko duela esan dezakegu. Beraz, X aldagaiaren entropia Y aldagaiaren menpe egongo dela esan dezakegu: <math>H(X,Y)=-\sum_{x,y} p(x,y) \log_2 p(x,y)</math> [[Bayesen teorema\|Bayes-en ~~teoremaren~~teorematik]] ~~arabera:~~ p(x,y)=p(y)p(x\|y) ~~badakigunez~~dela dakigu, non ~~p(x\|y)~~ Y ~~zein~~ezagututa ~~den jakinda~~ X egoera ~~bat~~ gertatzearen probabilitatea ~~den,~~p(x\|y) ~~honako~~den. ~~hau~~Honakoa adieraz ~~dezakegu~~daiteke: <math>H(X\|Y)=-\sum_{y} p(y) \sum_{x} p(x\|y) \log_2 p(x\|y)</math> 111 ⟶ 112 lerroa: == Ikus, gainera == * [[Informazio kantitate\|Informazio kantitatea]] * [[Baldintzazko entropia]] == Kanpoko loturak ==

Entropia (informazio-teoria): berrikuspenen arteko aldeak