Mətn tipli informasiyanın kodlaşdırılması
Mətn tipli informasiyanın baytlarla kodlaşdırılması bir neçə müxtəlif standarta əsaslanır, lakin əsas standart ABŞ-da ANSI Milli insitutunda işlənilmiş ASCII (American Standard Code or Information Interchange) standartı olmuşdur. Bütün tələblərin hər kəs tərəfindən ödənilməsinin təmin edilməsi üçün aşağıdakılar qəbul edilmişdir:
1. Hər biri bir bayt təşkil edən 256 koddan ilk 32-si (0-dan 31-ə qədər) kompyuter, printer və başqa qurğuların istehsalçılarına verilmişdir. Onlar bu kodları istədikləri əməliyyat üçün təyin edirlər. Lakin sonradan istehsalçılar tərəfindən bu kodlar üçün də standartlar işlənilmişdir, bu standartları qəbul etməyənlər isə sadəcə olaraq öz məhsullarını sata bilmədiklərinə görə bazardan çəkilmişlər. Məsələn, bütün kompyuter sistemlərində 13 kodu mətn daxil edilərkən abzasın bitməsi və yeni abzasın başlaması üçün istifadə edilir.
2. Qalan kodlar cədvəli iki hissəyə bölür: 32-dən 127-yə qədər olan kodlar dünyadakı bütün kompyuter sistemlərinin istifadə etdiyi simvolların kodlarını təşkil edir. 128-dən 255-ə qədər olan kodları isə hər bir ölkə özünə uyğun şəkildə yerləşdirə bilər.
Şəkil 1. ASCII cədvəli
ASCII cədvəlindən başqa digər kodlaşdırma sistemləri də mövcuddur. Bunlara misal olaraq Windows 1251, КОИ-8 və s. sistemlərini göstərmək olar. Bu sistemlərdə 1 simvolun kodlaşdırılması üçün 8 bit və ya 1 bayt istifadə edilir.
1991-ci ildə 16-bitlik Unicode (Yunikod) sistemi təklif edilmişdir. Bu sistemdə hər bir simvolun kodlaşdırılması üçün 2 bayt istifadə edilir: 1 bayt – simvolun kodlaşdırılması üçün, bir bayt isə əlamətinə görə ayrılır. Bununla yanaşı Unicod kodlaşdırma üsulunun ASCII standartı ilə informasiya uyğunluğu təmin edilir.
Unicode nə deməkdir? Yuxarıda qeyd etdiyimiz kimi, əvvəllər hər bir simvolun kodu yalnız bir baytdan ibarət idi, Unicode standartında isə hər bir simvol 2 bayt ilə kodlaşdırlır, bu da eyni zamanda 65536 simvolun işlədilməsinə yol açır. Bu ədəd isə dünyanın bütün əlifbalarını özündə saxlaya bilər. Bu 65536 kodun arasında “Ə”, “ə” hərfi üçün də (türk əlifbasında olduğundan dilimizin o biri “qeyri-standart” hərflərinin Unicode kodları əvvəldən məlum idi) yer tapıldı.
Nəhayət, 28 iyul 2001-ci ildə Azərbaycan dili üçün Unicode (2-baytlıq) və qeyri-Unicode (1 baytlıq) simvol kodlaşdırmaları və həmçinin klaviatura düzümü qəbul edildi. Əslində Unicode standartı çoxdan tətbiq olunurdu və bu sadəcə rəsmiləşdirildi.
Dostları ilə paylaş: |