Se afișează postările cu eticheta school. Afișați toate postările
Se afișează postările cu eticheta school. Afișați toate postările

duminică, 4 decembrie 2016

Codificare textelor


Este un lucru cunoscut că pentru măsurarea lungimii, temperaturii, masei, timpului etc au fost inventate aparate şi metode de măsurare. De exemplu, lungimea unui creion se determină cu ajutorul riglei, temperatura aerului - cu ajutorul termometrului, masa unui corp - cu ajutorul cântarului. Valorile concrete ale acestor mărimi se exprimă în anumite unităţi de măsură: lungimea - în metri, centimetri sau milimetri; temperatura - în grade; masa - în miligrame, grame sau kilograme.
Apare întrebarea, cum putem afla cantitatea de informaţie a unui text, a unei imagini sau a unei secvenţe sonore şi care sînt unităţile ei de măsură? Întrucât în calculator informaţia
de orice natură este reprezentată prin secvenţe de cifre binare, ca unitate de măsură a cantităţii de informaţie se foloseşte bitul. Amintim că bit este un acronim al cuvintelor .engleze binary digit "cifră binară".
Cantitatea de informaţie exprimă numărul minim de cifre binare necesare pentru codificarea şi decodificarea univocă a informaţiei
In cazul informaţiei textuale, fiecărui din cele 256 de simboluri (vezi tabelul 1.2) îi corespunde un cod unic format din 8 cifre binare. Este oare numărul de 8 cifre binare minimal? Răspunsul la această întrebare este afirmativ, întrucât utilizând 7 cifre binare putem reprezenta numai 27=128 de simboluri. Prin urmare, cantitatea de informaţie a unui simbol din codul ASCII este de 8 biţi.
în informatică, pentru măsurarea cantităţii de informaţie deopotrivă cu bitul se foloseşte şi octetul:
loctet = 23=8biţi.
Cantitatea de informaţie a unui text format din N simboluri este
/ = N (octeţi) sau / = 8 N (biţi).
De exemplu, cantitatea de informaţie în cuvîntul START este
I = 5 octeţi = 40 biţi.
O pagină de ziar conţine circa 10 mii de simboluri. Cantitatea de informaţie a unui ziar de 4 pagini este:
/ = 4 • 10 000 = 40 000 octeţi = 320 000 biţi.
Cantităţile mari de informaţie se exprimă prin multiplii bitului sau octetului:
l Kbit = 210 * IO3 biţi (l Kilobit, l mie biţi); l Mbit = 220 - IO6 biţi (l Megabit, l mln biţi); l Gbit = 230 « IO9 biţi (l Gigdbit, l mlrd biţi);
l Koctet = 210 « IO3 octeţi (l Kilooctet, l mie octeţi); l Moctet = 220 ~ IO6 octeţi (l Megaoctet, l mln octeţi); l Goctet = 230 ~ IO9 octeţi (l Gigaoctet, l mlrd octeţi).

în cazul exemplului de mai sus, cantitatea de informaţie a unui ziar este: / = 40 000 octeţi * 40 Kocteţi = 320 Kbiţi.

Sisteme de numeratie

Sisteme de numeratie
În calculatoarele digitale, informaţia de orice fel este reprezentată, stocată şi prelucrată în formă numerică. Numerele se prezintă prin simboluri elementare denumite cifre.
Totalitatea regulilor de reprezentare a numerelor împreună cu mulţimea cifrelor poartă denumirea de sistem de numeraţie. Numărul cifrelor defineşte baza sistemului de numeraţie.
Prezentăm câteva exemple de sisteme de numeraţie:
- sistemul zecimal este un sistem de numeraţie în baza 10, numărul de cifre utilizate fiind 10, respectiv, O, l, 2,..., 9;
- sistemul binar este un sistem de numeraţie în baza 2, numărul de cifre utilizate este
2. adică O şi 1. Cifrele respective se numesc cifre binare sau biţi. Cuvântul bit este un acronim al cuvintelor engleze binary digit "cifră binară";
- sistemul ternar este un sistem de numeraţie în baza 3, numărul de cifre utilizate fiind
3. respectiv, O, l şi 2;
- sistemul octal este un sistem de numeratie în baza 8, conţinând 8 cifre: O, l, 2,..., 7;
- sistemul hexazecimal este un sistem de numeratie în baza 16 şi conţine 16 cifre: O, l, 2,..., 9, A (zece), B (unsprezece), C (doisprezece), D (treisprezece), E (paisprezece), F (cincisprezece).
 Sistemele în care semnificaţia cifrelor depinde de poziţia ocupată în cadrul numerelor se numesc sisteme poziţionale de n urne raţie.
 Formal, sistemul zecimal nu prezintă nici un avantaj deosebit faţă de alte sisteme de numeraţie. Se presupune că acest sistem a fost adoptat încă din cele mai vechi timpuri datorită faptului că procesul de numărare a folosit ca instrumente iniţiale degetele mâinilor. Un calculator poate fi prevăzut să funcţioneze în orice sistem de numeraţie. Pe parcursul dezvoltării tehnicii de calcul, s-a stabilit că cel mai avantajos este sistemul binar
Operaţia de transformare a informaţiei în secvenţe de cifre binare se numeşte codificare. Operaţia inversă codificării se numeşte decodificare.
Codificarea se realizează de dispozitivele destinate introducerii informaţiei în calcula-1 Stor, iar decodificarea - de dispozitivele care prezintă informaţia din calculator într-o formă accesibilă omului.

Este necesar să reţinem că în procesul dezvoltării civilizaţiei umane au fost create şi sisteme de numeraţie nepoziţionale. Drept exemplu poate servi sistemul roman, care utilizează cifrele I (unu), V (cinci), X (zece), L (cincizeci), C (una sută), D (cinci sute), M (una mie). De exemplu, numărul 16 se exprimă în sistemul roman prin XVI, iar numărul 14 prin XIV. Întrucât regulile de reprezentare a numerelor şi de efectuare a operaţiilor aritmetice sânt foarte complicate, sistemele nepoziţionale au o utilizare foarte restrânsă.

Purtatori de informatie

Purtatori de informatie
Informaţia despre obiectele şi evenimentele din lumea în care trăim poate fi reprezentată în diferite forme:
- texte scrise sau tipărite;
- sunete (cuvinte, cântece, melodii);
- imagini statice (desene, fotografii, tablouri);
- imagini dinamice (filme cu desene animate, filme de cinema sau video).

 Obiectul material folosit pentru păstrarea, transmiterea sau prelucrarea informaţiei se numeşte purtător de informaţie.
Deosebim purtători statici şi purtători dinamici de informaţie.
Purtătorii statici se utilizează pentru păstrarea informaţiei. Primii purtători statici folosiţi de omenire au fost pietrele, plăcile de lut ars, papirusul. Un alt purtător static de informaţie este hârtia. Informaţia înregistrată pe hârtie în formă de manuscrise, desene sau texte tipărite poate fi păstrată un timp foarte îndelungat, în calculatoare, ca purtători statici se utilizează:
- hârtia pentru imprimantele mecanice, cu jet de cerneală, laser etc.;
- straturile active ale benzilor şi discurilor magnetice;
- straturile reflectorizante ale discurilor optice etc.
Purtătorii dinamici se utilizează pentru transmiterea informaţiei, în calitate de purtători dinamici tehnica actuală foloseşte:
- unde acustice în gaze (aer) sau lichide (apă);
- tensiuni şi curenţi electrici;
- unde electromagnetice etc.

Orice sistem tehnic utilizează acei purtători de informaţie, care-i asigură o realizare cât mai bună a funcţiilor pentru care a fost conceput. Reţelele telefonice utilizează curenţi electrici, radioul şi televiziunea-unde electromagnetice. Calculatoarele moderne utilizează curenţi electrici, hârtie, benzi, discuri şi cartele magnetice, discuri optice.