PRETRAŽIVANJE SITE

Kodiranje tekstualnih podataka na računalu

Računalo je složeni uređaj, uz pomoćkoji mogu stvoriti, pretvoriti i pohraniti podatke. Međutim, računalo nam ne djeluje sasvim razumljivo - grafički, tekstualni i numerički podaci pohranjeni su kao polja binarnog

kodiranje tekstualnih podataka
brojevi. U ovom ćemo članku pratiti kako su tekstualne informacije kodirane.

Što je za nas tekst, za računalo -slijed simbola. Svaki simbol predstavlja poseban skup zerova i onih. Pod simbolima se podrazumijevaju ne samo mala i velika slova latinske abecede, ali i interpunkcijske znakove, aritmetičke znakove, servisne simbole, posebne simbole, pa čak i prostor.

Binarno kodiranje tekstualnih podataka

Kada pritisnete određeni ključ na unutarnjemkontrolor šalje električni signal koji se pretvara u binarni kod. Kôd se podudara s određenim znakom koji se prikazuje. Za prikaz latinske abecede u digitalnom formatu, stvoren je međunarodni sustav za kodiranje ASCII. To zahtijeva 1 bajt za pisanje jednog znaka, stoga se simbol sastoji od osmeroznamenkastog slijeda nula i jednog. Interval snimanja je od 00000000 do 11111111, tj. Kodiranje tekstualnih informacija korištenjem ovog sustava omogućuje prikaz 256 simbola. U većini slučajeva to je dovoljno.

binarno kodiranje tekstualnih podataka

ASCII je podijeljen u dva dijela. Prvih 127 znakova (od 00000000 do 01111111) međunarodni su i predstavljaju određene znakove i slova engleske abecede. Drugi dio - produžetak (od 10.000.000 do 1111.1111) - namjerava predstavljati nacionalnu abecedu, čije se pisanje razlikuje od latinske.

Kodiranje tekstualnih informacija u ASCIIje izgrađen na principu povećanja slijeda, to jest, to je veći broj latinskog slova, veća je vrijednost njegovog ASCII koda. Brojke i ruski dio stola izgrađeni su na istom principu.

Međutim, postoji još nekoliko vrsta na svijetukodiranje za ćirilici. Najčešći - je KOI-8 (osam-bitni kodiranje koje se koristi za u 70 u prvi ruifitsirovannyh Unix operativnog sustava), ISO 8859-5 (razvijen od strane International Standardization zavoda), CP 1251 (kodiranja tekstualni podatak koristi u

kodiranje i obradu tekstualnih podataka
moderni Windows OS), kao i 2-byteUnicode kodiranje s kojim možete predstavljati 65536 znakova. Takva raznolikost kodiranja uvjetovana je činjenicom da su razvijeni u različito vrijeme, za različite operacijske sustave i iz raznih razloga. Zbog toga često dolazi do poteškoća pri prijenosu teksta s jednog medija u drugi - ako se kodiranja ne podudaraju, korisnik će vidjeti samo skup nerazumljivih ikona. Kako možete popraviti ovu situaciju? U programu Word, na primjer, kada otvorite dokument, primit ćete poruku o problemima s prikazivanjem teksta i nudi nekoliko opcija za transkodiranje.

Dakle, kodiranje i obradu tekstainformacije u dubinama računala - proces je prilično složen i dugotrajan. Svi simboli bilo koje abecede predstavljaju samo određeni niz znamenki binarnog sustava, jedna stanica je jedan bajt informacija.

</ p>
  • Ocjenjivanje: