Informazio-unitate
Informatikan eta telekomunikazioetan, informazio-unitate bat datuak biltegiratzeko sistema estandar batzuek erabiltzen duten edukiera-neurri bat da (edo komunikazio kanal batzuena). Unitate horiek beste sistema eta kanal batzuek duten edukiera-ahalmena neurtzeko erabiltzen dira. Informazioaren teorian ere erabiltzen dira informazio-unitateak, informazio edukiak edo ausazko aldagaien entropia neurtzeko.
Unitate ohikoenak bi dira: bit, bakarrik bi egoera posible dituen sistema baten edukiera, eta byte (edo zortzikote), zortzi biten baliokidea dena. Unitate horien multiploak eratu daitezke horiekin batera SI aurrizkiak (hamar zenbakiaren potentziak definitzeko aurrizkiak) edo berriagoak diren IEC aurrizki bitarrak (bi zenbakiaren potentziak definitzeko aurrizkiak). Berez, zehatz-mehatz hitz eginez, informazio-edukiera ezin da neurtu.
Lehen mailako unitateak
aldatu1928an, Ralph Hartley-k oinarrizko biltegiratze-printzipioaz konturatu zen,[1] geroago 1945ean Claude Shannon-ek formalizatu zuen: N egoera posible dituen sistema batean gorde daitekeen informazioa logb N logaritmoarekin proportzionala da. Logaritmoaren oinarria aldatuz gero, b batetik c beste zenbaki batera pasatuz, eragina logaritmoaren balioa konstante finko batez biderkatzea izango da, hots, logcI = (logcb) logbI. Hori dela eta, b oinarriak zehazten du informazioa neurtzeko erabiltzen den unitatea. Beraz, b osoko positiboa bat bada, unitate hori N egoera posible dituen sistema batean gorde daitekeen informazioa da. Beste adibide batzuk:
b = 2 denean, shannon izena du unitateak, eta "bit" bateko edukiera da ('binary digit'-en laburdura[2]). 8 egoera dituen sistema batek, adibidez, log28 = 3 informazio-bit gorde ditzake. Badira izendatu diren beste unitate batzuk, besteak beste:
- b = 3 denean: "trit" izeneko unitatea, eta ondoko balioa du: log2 3 (≈ 1.585) bit.[3]
- b = 10 denean: hamartar digitu izeneko unitatea edo teo, ban, decit, edo dit, eta ondoko balioa du: log2 10 (≈ 3.322) bit.[1][4]
- b = e denean, (e zenbakia): nat, nit, edo nepit (Neperiar-etik) izenak erabiltzen dira, eta balioa hau da: log2 e (≈ 1.443) bit.[1]
Trit, ban, eta nat oso gutxitan erabiltzen dira; baina nat, bereziki, askotan erabiltzen da informazioaren teorian, logaritmo naturalak batzuetan ohiko logaritmoak baino erosoagoak direlako.
Bit
aldatuBit-a informazio unitate txikiena da, bakarrik bi egoera posible ditu eta bietatik bat hartzen du, hala nola, bai edo ez, zero edo bat, gora edo behera, egia edo gezurra...
Bit-etik eratorritako unitateak
aldatuBit-aren zenbait multiplo ohikoak dira informazio-unitate gisa.
Byte
aldatuHistorikoki, byte bat konputagailuan testu-karaktere bat errepresentatzeko bit kopurua zen, baina hori konputagailuaren hardware-arkitektura arabera alda zitekeen; gaur egun, ia beti,zortzi bit esan nahi du — hau da, zortzikote bat. Byte batekin 256 (28) balio desberdin irudikatu daiteke, hala nola osokoak 0tik 255raino, edo -128tik 127raino. IEEE 1541-2002 estandarrak "B" karakterea (larriz) zehazten du byte-a adierazteko ikur gisa. Byte-ak, edo horren multiploak dira ia beti erabiltzen diren unitateak konputagailuko fitxategien tamaina edo biltegiratze-edukiera zehazteko. Konputagailu moderno gehienak eta periferikoak diseinatuta egoten dira beti datuak byte-ka edo byte taldeka manipulatzeko eta ez banakako bit-eka.
Nibble
aldatuLau bit-eko talde bat, edo byte erdi bat. Zenbaki hamaseitarrekin hau da gehien erabiltzen den unitatea.[5]
Hitza, bloke, eta orria
aldatuOrdenagailuek normalean bitak tamaina finkoko taldetan manipulatzen dituzte, gehienetan hitzak esaten zaie talde horiei. Hitz bateko bit kopurua normalean ordenagailuaren CPUko erregistroen tamainak definitzen du , edo memoria nagusiko bilaketa batean eragiketa bakar batean aztertu daitekeen bit kopuruaren arabera. Ohikoa den IA-32 arkitekturan hitz bat 16 bit dira, baina iraganeko eta gaur egungo beste arkitekturek erabiltzen dituzten hitzak 8, 24, 32, 36, 56, 64, 80 bit-ekoak izan daitezke.
Makina-lengoaia batzuek eta konputagailuko zenbaki-formatu batzuek bi hitz erabiltzen dituzte ("hitz bikoitza", "double word" edo "dword"), edo lau hitz ("quad hitza" edo "quad").
Ordenagailuetako cache memoriek normalean hainbat ondoz ondoko hitzetako blokeekin lan egiten dute. Unitate horiek normalean izen hauek hartzen dituzte: cache blokeak, edo, CPU cache-etan, cache-lerroak.
Memoria birtualeko sistemetan ordenagailuaren memoria nagusia partiziotan banatzen dute, tradizionalki orriak izenarekin ezagutzen diren informazio-unitateak erabiltzen dira horien tamaina zehazteko.
Multiplo sistematikoak
aldatuBit kantitate handiak izendatzeko terminoak sortu izan dira SI aurrizki estandarrak erabilita 10 zenbakiaren potentzietarako; adibidez, kilo = 103 = 1000 (kilobit edo kbit), mega- = 106 = 1000000 (megabit edo Mbit) eta giga = 109 = 1000000000 (gigabit edo Gbit). Aurrizki horiek maizago erabiltzen dira byte-multiploetarako, kilobyte (1 kB = 8000 bit), megabyte (1 MB = 8000000bit), eta gigabyte (1 GB = 8000000000bit).
Hala ere, arrazoi teknikoak direla medio, konputagailuetako memorien edukiera neurtzeko askotan bi zenbakiaren potentziak erabiltzen dira, esaterako, 228 = 268435456 byte. Zenbaki baldar horien erabilera sahiestearren, jendeak askotan SI aurrizkiak erabiltzen ditu gutxi gorabeherako zenbakiak adieratzeko, adibidez, erabiltzen da kiloaurrizkia 210 = 1024 zenbakiaren ordez, mega 220 = 10485761048576 zenbakiaren ordez, giga 230 = 10737418241073741824 zenbakiaren ordez, eta abar. Adibidez, ausazko sarbidezko memoriazko txip batekin edukiera 228 byte izango litzateke baina 256-megabyteko txipa esan ohi da. Ondoko taulan erakusten dira desberdintasun horiek.
Ikurra | Aurrizkia | SI Esanahia | Esanahi bitarra | Tamaina-aldea |
---|---|---|---|---|
k | kilo | 103 = 10001 | 210 = 10241 | 2.40% |
M | mega | 106 = 10002 | 220 = 10242 | 4.86% |
G | giga | 109 = 10003 | 230 = 10243 | 7.37% |
T | tera | 1012 = 10004 | 240 = 10244 | 9.95% |
P | peta | 1015 = 10005 | 250 = 10245 | 12.59% |
E | exa | 1018 = 10006 | 260 = 10246 | 15.29% |
Z | zetta | 1021 = 10007 | 270 = 10247 | 18.06% |
Y | yotta | 1024 = 10008 | 280 = 10248 | 20.89% |
Iraganean, maiuskulazko K erabili ordez minuskulazko k aurrizkiaz adierazi nahi izan zen 1024 erabiltzen zela 1000 ordez. Baina horren erabilera ez zen inoiz koherentziaz aplikatu.
Beste alde batetik, kanpoko biltegiratze-sistemetan (hala nola, disko optikoa), SI aurrizkiak erabiltzen ziren normalean beren hamartar balioekin (10 zenbakiaren potentziak). Asko izan dira saiakerak nahasmen hori konpontzeko. 1998an, Nazioarteko Batzorde elektroteknikoak (IEC) estandar bat argitaratu zuen helburu horrekin, hots, aurrizki bitarrezko serie bat 1024 zenbakia 1000 ordez erabiltzen den kasuetarako:[6]
Ikur | Aurrizkia | |||
---|---|---|---|---|
Ki | kibi, binary kilo | 1 kibibyte (KiB) | 210 byte | 1024 B |
Mi | mebi, binary mega | 1 mebibyte (MiB) | 220 byte | 1024 KiB |
Gi | gibi, binary giga | 1 gibibyte (GiB) | 230 byte | 1024 MiB |
Ti | tebi, tera bitar | 1 tebibyte (TiB) | 240 byte | 1024 GiB |
Pi | pebi, binary peta | 1 pebibyte (PiB) | 250 byte | 1024 TiB |
Ei | exbi, binary exa | 1 exbibyte (EiB) | 260 byte | 1024 PiB |
Tamainaren adibideak
aldatu- 1 bit – bai/ez motako galdera batentzako erantzun bat
- 1 byte – kopuru bat 0-tik 255raino.
- 90 byte: nahikoa testu liburu bateko lerro bat gordetzeko
- 512 byte = ½ KiB: ohiko disko gogor bateko sektore bat gordetzeko nahikoa
- 1024 byte = 1 KiB: UNIX fitxategi-sistemako bloke klasikoen tamaina.
- 2048 byte = 2 KiB: CD-ROM sektore bat.
- 4096 byte = 4 KiB: memoria orri bat x86-n ( Intel 80386 prozesadoreaz geroztik).
- 4 kB: eleberri bateko testuzko orrrialde bat
- 120 kB: Poltsikozko liburu bat.
- 1 MB – 1024×1024 pixel-mapako irudiak 256 kolorerekin.
- 3 MB – hiru minutuko abestia (133 kbit/s)
- 650-900 MB – CD-ROM bat
- 1 GB – 114 minutuko CD-kalitatezko audio bat (1.4 Mbit/s)
- 8/16 GB – flash-drive unitate baten normala
- 4 TB – 150 euroko disko gogorra (2014koa edo)
- 1.3 ZB – interneteko bolumen osoaren estimazioa 2016an.
Erreferentziak
aldatu- ↑ a b c Norman Abramson (1963), Information theory and coding.
- ↑ Mackenzie, Charles E. (1980).
- ↑ Donald E. Knuth, The Art of Computer Programming, vol.2: Seminumerical algorithms.
- ↑ Shanmugam (2006), Digital and Analog Computer Systems.
- ↑ Nybble at dictionary reference.com; sourced from Jargon File 4.2.0, accessed 2007-08-12
- ↑ ISO/IEC standard is ISO/IEC 80000-13:2008.