Informazio-unitate

Informazio-unitateak» orritik birbideratua)

Informatikan eta telekomunikazioetan, informazio-unitate bat datuak biltegiratzeko sistema estandar batzuek erabiltzen duten edukiera-neurri bat da (edo komunikazio kanal batzuena). Unitate horiek beste sistema eta kanal batzuek duten edukiera-ahalmena neurtzeko erabiltzen dira. Informazioaren teorian ere erabiltzen dira informazio-unitateak, informazio edukiak edo ausazko aldagaien entropia neurtzeko.

Unitate ohikoenak bi dira: bit, bakarrik bi egoera posible dituen sistema baten edukiera, eta byte (edo zortzikote), zortzi biten baliokidea dena. Unitate horien multiploak eratu daitezke horiekin batera SI aurrizkiak (hamar zenbakiaren potentziak definitzeko aurrizkiak) edo berriagoak diren IEC aurrizki bitarrak (bi zenbakiaren potentziak definitzeko aurrizkiak). Berez, zehatz-mehatz hitz eginez, informazio-edukiera ezin da neurtu.

Lehen mailako unitateak

aldatu
 
Informazio-unitateen arteko konparazioa: bit, trit, nat, ban. Informazio kantitatea barren altuera da. Berde iluneko maila "Nat" unitatea da.

1928an, Ralph Hartley-k oinarrizko biltegiratze-printzipioaz konturatu zen,[1] geroago 1945ean Claude Shannon-ek formalizatu zuen: N egoera posible dituen sistema batean gorde daitekeen informazioa logb N logaritmoarekin proportzionala da. Logaritmoaren oinarria aldatuz gero, b batetik c beste zenbaki batera pasatuz, eragina logaritmoaren balioa konstante finko batez biderkatzea izango da, hots, logcI = (logcb) logbI. Hori dela eta, b oinarriak zehazten du informazioa neurtzeko erabiltzen den unitatea. Beraz, b osoko positiboa bat bada, unitate hori N egoera posible dituen sistema batean gorde daitekeen informazioa da. Beste adibide batzuk:

b = 2 denean, shannon izena du unitateak, eta  "bit" bateko edukiera da ('binary digit'-en laburdura[2]). 8  egoera dituen sistema batek, adibidez,  log28 = 3 informazio-bit gorde ditzake. Badira izendatu diren beste unitate batzuk, besteak beste:

  • b = 3 denean:  "trit" izeneko unitatea, eta ondoko balioa du: log2 3 (≈ 1.585) bit.[3]
  • b = 10 denean: hamartar digitu izeneko unitatea edo teo, ban, decit, edo dit, eta ondoko balioa du: log2 10 (≈ 3.322) bit.[1][4]
  • b = e denean, (e zenbakia)nat, nit, edo nepit (Neperiar-etik) izenak erabiltzen dira, eta balioa hau da: log2 e (≈ 1.443) bit.[1]

Trit, ban, eta nat oso gutxitan erabiltzen dira; baina nat, bereziki, askotan erabiltzen da informazioaren teorian, logaritmo naturalak   batzuetan ohiko logaritmoak baino erosoagoak direlako.

Bit-a informazio unitate txikiena da, bakarrik bi egoera posible ditu eta bietatik bat hartzen du, hala nola, bai edo ez, zero edo bat, gora edo behera, egia edo gezurra...

Bit-etik eratorritako unitateak

aldatu

Bit-aren zenbait multiplo ohikoak dira  informazio-unitate gisa.

Historikoki, byte bat konputagailuan testu-karaktere bat errepresentatzeko bit kopurua zen, baina hori konputagailuaren hardware-arkitektura arabera alda zitekeen; gaur egun, ia beti,zortzi bit esan nahi du — hau da, zortzikote bat. Byte batekin 256 (28) balio desberdin irudikatu daiteke, hala nola osokoak 0tik 255raino, edo -128tik 127raino. IEEE 1541-2002 estandarrak "B" karakterea (larriz) zehazten du byte-a adierazteko ikur gisa. Byte-ak, edo horren multiploak dira ia beti erabiltzen diren unitateak konputagailuko fitxategien tamaina edo biltegiratze-edukiera zehazteko. Konputagailu moderno gehienak eta periferikoak diseinatuta egoten dira beti datuak byte-ka edo byte taldeka manipulatzeko eta ez banakako bit-eka.

Nibble

aldatu

Lau bit-eko talde bat, edo byte erdi bat.  Zenbaki hamaseitarrekin hau da gehien erabiltzen den unitatea.[5]

Hitza, bloke, eta orria

aldatu

Ordenagailuek normalean bitak tamaina finkoko taldetan manipulatzen dituzte, gehienetan hitzak esaten zaie talde horiei. Hitz bateko bit kopurua normalean ordenagailuaren CPUko  erregistroen tamainak definitzen du , edo memoria nagusiko bilaketa batean eragiketa bakar batean aztertu daitekeen bit kopuruaren arabera. Ohikoa den IA-32 arkitekturan hitz bat 16 bit dira, baina iraganeko eta gaur egungo beste arkitekturek erabiltzen dituzten hitzak 8, 24, 32, 36, 56, 64, 80 bit-ekoak izan daitezke.

Makina-lengoaia batzuek eta konputagailuko zenbaki-formatu batzuek bi hitz erabiltzen dituzte ("hitz bikoitza", "double word" edo "dword"), edo lau hitz ("quad hitza" edo "quad").

Ordenagailuetako cache memoriek normalean hainbat ondoz ondoko hitzetako  blokeekin lan egiten dute. Unitate horiek normalean izen hauek hartzen dituzte: cache blokeak, edo, CPU cache-etan, cache-lerroak.

Memoria birtualeko sistemetan ordenagailuaren memoria nagusia partiziotan banatzen dute, tradizionalki orriak izenarekin ezagutzen diren informazio-unitateak erabiltzen dira horien tamaina zehazteko.

Multiplo sistematikoak

aldatu

Bit kantitate handiak izendatzeko terminoak sortu izan dira SI aurrizki estandarrak erabilita 10 zenbakiaren potentzietarako; adibidez, kilo = 103 = 1000 (kilobit edo kbit), mega- = 106 = 1000000 (megabit edo Mbit) eta giga = 109 = 1000000000 (gigabit edo Gbit). Aurrizki horiek  maizago erabiltzen dira byte-multiploetarako, kilobyte (1 kB = 8000 bit), megabyte (1 MB = 8000000bit), eta gigabyte (1 GB = 8000000000bit).

Hala ere, arrazoi teknikoak direla medio,  konputagailuetako memorien edukiera neurtzeko askotan bi zenbakiaren potentziak erabiltzen dira, esaterako, 228 = 268435456 byte. Zenbaki baldar horien erabilera sahiestearren, jendeak askotan SI aurrizkiak erabiltzen ditu gutxi gorabeherako zenbakiak adieratzeko, adibidez, erabiltzen da kiloaurrizkia 210 = 1024 zenbakiaren ordez, mega 220 = 10485761048576 zenbakiaren ordez, giga 230 = 10737418241073741824 zenbakiaren ordez, eta abar. Adibidez, ausazko sarbidezko memoriazko txip batekin edukiera 228 byte izango litzateke baina 256-megabyteko txipa esan ohi da. Ondoko taulan erakusten dira desberdintasun horiek.

Ikurra Aurrizkia SI Esanahia Esanahi bitarra Tamaina-aldea
k kilo 103 = 10001 210 = 10241 2.40%
M mega 106 = 10002 220 = 10242 4.86%
G giga 109 = 10003 230 = 10243 7.37%
T tera 1012 = 10004 240 = 10244 9.95%
P peta 1015 = 10005 250 = 10245 12.59%
E exa 1018 = 10006 260 = 10246 15.29%
Z zetta 1021 = 10007 270 = 10247 18.06%
Y yotta 1024 = 10008 280 = 10248 20.89%

Iraganean, maiuskulazko K erabili ordez minuskulazko k aurrizkiaz adierazi nahi izan zen  1024 erabiltzen zela 1000 ordez. Baina horren erabilera ez zen inoiz koherentziaz aplikatu.

Beste alde batetik, kanpoko biltegiratze-sistemetan (hala nola, disko optikoa), SI aurrizkiak erabiltzen ziren normalean beren hamartar balioekin (10 zenbakiaren potentziak). Asko izan dira saiakerak nahasmen hori konpontzeko. 1998an, Nazioarteko Batzorde elektroteknikoak (IEC) estandar bat argitaratu zuen helburu horrekin, hots, aurrizki bitarrezko serie bat 1024 zenbakia 1000 ordez  erabiltzen den kasuetarako:[6]

Ikur Aurrizkia
Ki kibi, binary kilo 1 kibibyte (KiB) 210 byte 1024 B
Mi mebi, binary mega 1 mebibyte (MiB) 220 byte 1024 KiB
Gi gibi, binary giga 1 gibibyte (GiB) 230 byte 1024 MiB
Ti tebi, tera bitar 1 tebibyte (TiB) 240 byte 1024 GiB
Pi pebi, binary peta 1 pebibyte (PiB) 250 byte 1024 TiB
Ei exbi, binary exa 1 exbibyte (EiB) 260 byte 1024 PiB

Tamainaren adibideak

aldatu
  • 1 bit –  bai/ez motako galdera batentzako erantzun bat
  • 1 byte – kopuru bat 0-tik 255raino.
  • 90 byte: nahikoa testu liburu bateko lerro bat gordetzeko
  • 512 byte = ½ KiB: ohiko disko gogor bateko sektore bat gordetzeko nahikoa
  • 1024 byte = 1 KiB: UNIX fitxategi-sistemako bloke klasikoen tamaina.
  • 2048 byte = 2 KiB:  CD-ROM sektore bat.
  • 4096 byte = 4 KiB: memoria orri bat x86-n ( Intel 80386 prozesadoreaz geroztik).
  • 4 kB:  eleberri bateko testuzko orrrialde bat
  • 120 kB: Poltsikozko liburu bat.
  • 1 MB – 1024×1024 pixel-mapako irudiak 256 kolorerekin.
  • 3 MB – hiru minutuko abestia (133 kbit/s)
  • 650-900 MB – CD-ROM bat
  • 1 GB – 114 minutuko CD-kalitatezko audio  bat (1.4 Mbit/s)
  • 8/16 GB – flash-drive unitate baten normala
  • 4 TB –  150 euroko disko gogorra (2014koa edo)
  • 1.3 ZB – interneteko bolumen osoaren estimazioa 2016an.

Erreferentziak

aldatu
  1. a b c Norman Abramson (1963), Information theory and coding.
  2. Mackenzie, Charles E. (1980).
  3. Donald E. Knuth, The Art of Computer Programming, vol.2: Seminumerical algorithms.
  4. Shanmugam (2006), Digital and Analog Computer Systems.
  5. Nybble at dictionary reference.com; sourced from Jargon File 4.2.0, accessed 2007-08-12
  6. ISO/IEC standard is ISO/IEC 80000-13:2008.

Kanpo estekak

aldatu