Yo'qotilgan siqishsiqilgan arxivni bo'shatgandan so'ng, avvalgisidan biroz farq qiladigan ma'lumotlar olinadi. Shubhasiz, siqilish darajasi qanchalik katta bo'lsa, yo'qotish hajmi va aksincha.
Albatta, bunday algoritmlar matnli hujjatlar, ma'lumotlar bazasi jadvallari va dasturlarida qo'llanilmaydi. Oddiy, formatlanmagan matnda siz ozgina buzilishlardan omon qolishingiz mumkin, ammo dasturda kamida bitta bitni buzish uni to'liq ishlamay qolishiga olib keladi.
Shu bilan birga, o'nlab marta siqishni olish uchun ma'lumotlarning bir necha foizini qurbon qilish mumkin bo'lgan ma'lumotlar mavjud, masalan, fotosuratlar, video va audio materiallar. Bunday ma'lumotlarning siqilishi va keyinchalik dekompressiyasi paytida yo'qolishi qo'shimcha "shovqin" paydo bo'lishi sifatida qabul qilinadi.
Axborot yo'qotishni siqish algoritmlari quyidagilar kabi algoritmlarni o'z ichiga oladi Jpeg(rasmlarni siqishda foydalaniladi) va MPEG(video va audioni siqishda foydalaniladi). Axborot yo'qotishlarni siqish algoritmlari faqat iste'molchilar uchun mo'ljallangan vazifalar uchun ishlatiladi.
Siqish paytida ruxsat etilgan yo'qotishning kattaligi odatda boshqarilishi mumkin, bu sizga "o'lcham / sifat" ning maqbul nisbatiga erishishga imkon beradi. Ekranda namoyish etilishi mo'ljallangan fotografiyalarda ma'lumotning 5% yo'qolishi odatda tanqidiy emas, ba'zi hollarda esa 20-25% yo'qolishi mumkin.
Usullari ma'lumotni yo'qotmasdan siqishniular matnli hujjatlar va dasturlar bilan ishlashda qo'llaniladi va ma'lumotlarning yo'qolishiga yo'l qo'ymaydi. Ular faqat uning ortiqcha bo'lishini yo'q qilishga asoslangan.
1-misolUkraina tilida 32 ta harf, o'nta raqam va o'nlab o'nlab tinish belgilari va boshqa maxsus belgilar mavjud. Faqat katta harflar bilan yozilgan matn uchun (telegramdagi kabi) oltmish xil ma'no etarli bo'ladi. Biroq, har bir belgi odatda 8 bitdan iborat va 256 xil kodlarni ifoda etadigan baytda kodlangan. Bu zaxira uchun birinchi asosdir. "Telegraf" matni uchun har bir belgi uchun 6 bit etarli bo'ladi.
Shakl 1. Morse kodi
2-misolXalqaro ASCII belgilar kodlashda har qanday belgi kodlash uchun bir xil miqdordagi bitlar ajratilgan (8). Biroq, eng keng tarqalgan belgilar kamroq belgilarni kodlash uchun mantiqiy ekanligi aniq. Shunday qilib, masalan, in morse kodiko'pincha topilgan "E" va "T" harflari bitta belgi bilan kodlangan (mos ravishda bu nuqta va tire). Va "Yu" (-) va "Ts" (- -) kabi noyob harflar to'rtta belgi bilan kodlangan. Samarasiz kodlash - bu ortiqcha to'lovning ikkinchi sababi.
Axborotni siqishni amalga oshiradigan dasturlar o'zlarining kodlashlarini (turli xil fayllar uchun har xil) kiritishlari va siqilgan faylga ma'lum bir jadval (lug'at) belgilashlari mumkin, bunda paketdan chiqarish dasturi ushbu faylda qanday belgilar va ularning guruhlari kodlanganligini bilib oladi. Axborotni transkodlashga asoslangan algoritmlar deyiladi xuffman algoritmlari.
Ikki nusxadagi bo'laklarning mavjudligi ortiqcha sonning uchinchi sababi hisoblanadi. Bu matnlarda kam uchraydi, lekin jadval va grafikalarda kodlarning takrorlanishi odatiy holdir. Masalan, agar 0 soni ketma-ket yigirma marta takrorlangan bo'lsa, unda yigirma nol baytni qo'yish mantiqiy emas. Buning o'rniga, ular bitta nol va 20 koeffitsientini qo'yadilar. Takrorlanishlarni aniqlashga asoslangan bunday algoritmlar usul deb ataladi seriyali uzunlikdagi kodlash(RLE,Kod uzunligini kodlash) Bir xil baytlarning katta takroriy ketma-ketligi ayniqsa grafik rasmlar bilan ajralib turadi. Usul "pikselga bayt" formatidagi grafik tasvirlar uchun juda samarali (masalan, formatlar) Pcxyoki BMP).
Qattiq disklarda zaxira nusxalarini yaratishda, fayllarni siqish paytida ish joyida daromad olishning yana bir imkoniyati mavjud, bu ma'lumotlarning ko'payishi bilan emas, balki kompyuterning fayl tizimini tashkil qilish bilan bog'liq. Uning mohiyati shundan iboratki, katta yoki kichik har qanday fayl faqat diskdagi butun sonlarni egallashi mumkin. FAT16 fayl tizimida qattiq diskda 65536 dan ortiq klaster bo'lishi mumkin (2 16). Bu shuni anglatadiki, hajmi 1 dan 2 GB gacha bo'lgan drayvlar uchun klaster hajmi 32 Kbni tashkil qiladi.
Katta guruhli fayllarni bitta faylga siqish paytida, fayl tizimining mantiqsiz tashkil etilishi natijasida yo'qotishlarning kamayishi tufayli bitta faylga kamida 16 Kbayt tejash kerak.
FAT32 uchun daromad kichikroq, ammo bu holda klasterning minimal hajmi 4 KB ni tashkil qiladi, shuning uchun ko'p miqdordagi kichik fayllar bilan ishlayotgan bo'lsangiz, unda saqlash kerak bo'lgan narsa ham mavjud.
Ko'p turli xil siqish usullari mavjud bo'lsa-da, ba'zilari mavjud tamoyillari va qoidalaribu barcha siqish usullariga xosdir. Ular ma'lum bo'lishi va to'g'ri ishlatilishi kerak.