Topshirdi: G’offoraliyev A. Qabul qildi: Ro’zaliyev A



Yüklə 2,28 Mb.
Pdf görüntüsü
səhifə5/9
tarix19.12.2023
ölçüsü2,28 Mb.
#185481
1   2   3   4   5   6   7   8   9
deadline

3-Amaliy mashg’ulot
Mavzu:
Tesseract kutubxonasidan foydalanish va qo‘llash
Ishdan maqsad
: Tesseract kutubxonasidan foydalanish va qo‘llash va rasmdam
matinni o’qib olish.
Kerakli johozlar
: kompyuter hamda internet.
Nazariy qism
Tesseract - bu Google tomonidan boshqariladigan ochiq manbali optik belgilarni
aniqlash (OCR) dvigatelidir. U turli xil tasvir fayl formatlari va skanerlangan
hujjatlardan matnni tanib olish va chiqarishga qodir bo'lgan eng aniq OCR
dvigatellaridan biri sifatida keng tarqalgan. Dastlab Hewlett-Packard tomonidan
1980-yillarda ishlab chiqilgan va keyinroq 2005 yilda ochiq manba sifatida
chiqarilgan Tesseract o'shandan beri Google va ochiq manbalar hamjamiyati
tomonidan faol ishlab chiqilgan va takomillashtirilmoqda.


Tesseractning asosiy xususiyatlari va imkoniyatlari quyidagilardan iborat:
1. **Tilni qo‘llab-quvvatlash**: Tesseract bir nechta tillarda tanishni qo‘llab-
quvvatlaydi, bu uni turli skriptlar va tillarda, jumladan lotin, kirill, arab va boshqa
ko‘plab tillarda matnni qayta ishlash uchun ko‘p qirrali vositaga aylantiradi.
2. **Aniqlik va ishonchlilik**: Tesseract har xil turdagi tasvirlar, jumladan,
skanerlangan hujjatlar, fotosuratlar va matnning boshqa grafik tasvirlaridan matnni
tanib olishda yuqori aniqligi bilan mashhur.
3. **Ochiq manba va hamjamiyat tomonidan boshqariladigan**: Tesseract ochiq
manbali loyiha sifatida qo‘llab-quvvatlanadi, bu esa ishlab chiquvchilarga uni
takomillashtirish va takomillashtirishga hissa qo‘shish imkonini beradi. Bu uning
asosiy tanib olish algoritmlarining doimiy yangilanishi va yaxshilanishiga olib
keldi, bu esa uni ishonchli va dolzarb OCR yechimiga aylantirdi.
4. **Moslashuvchanlik va moslashtirish**: Tesseract foydalanuvchilarga OCR
jarayonini sozlash va nozik sozlash uchun turli xil variantlarni taqdim etadi, bu
ularga muayyan foydalanish holatlari va muhitlar uchun tanib olish aniqligini
yaxshilash imkonini beradi.
5. **Buyruqlar qatori interfeysi va kutubxonani qo‘llab-quvvatlash**: Tesseract
buyruqlar qatoridan ishlatilishi yoki o‘zining API kutubxonasi yordamida
ilovalarga birlashtirilishi mumkin, bu esa uni turli dasturlash tillari va muhitlar
uchun foydalanish imkonini beradi.
6. **Dastlabki ishlov berish va keyingi qayta ishlashni qo‘llab-quvvatlash**:
Tesseract OCR natijalarini yaxshilash uchun turli xil qayta ishlash va keyingi
ishlov berish usullarini qo‘llab-quvvatlaydi, jumladan, tasvirni oldindan qayta
ishlash, shovqinni kamaytirish va matndan keyingi ishlov berish.


Tesseract keng doiradagi dasturlarni topdi, jumladan, hujjatlarni qayta ishlash,
ma'lumotlarni olish, arxivni raqamlashtirish va boshqalar. Uning ochiq manbali
tabiati, mustahkam tanib olish imkoniyatlari bilan birgalikda, uni ilovalar va ish
jarayonlarida ishonchli OCR funksiyalarini izlayotgan ishlab chiquvchilar va
tashkilotlar uchun mashhur tanlovga aylantirdi. Bundan tashqari, Tesseract-ning
boshqa texnologiyalar va ramkalar bilan integratsiyalashuvi matnni chiqarish va
tahlil qilishga qaratilgan turli dasturiy echimlarda foydalanishni osonlashtirdi.

Yüklə 2,28 Mb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin