liniyalarining alohida bo'limlarining tartibi, tezligi va yo'nalishi ma'lum
bo'lganligidan foydalanadi. Bundan tashqari, foydalanuvchi faqat yozishning o'ziga
xos shakllaridan foydalanishni o'rganadi. Ushbu usullarni skanerlangan qog'oz
hujjatlarini ishlatadigan dasturiy ta'minotda qo'llash mumkin emas, shuning uchun
qo'lda yozilgan "chop etilgan" matnni tanib olish muammosi hali ham ochiq
qolmoqda. Artefaktlarsiz qo'lda yozilgan "bosma" matnli rasmlarda 80% - 90%
aniqlikka erishish mumkin, ammo bu aniqlik bilan rasm sahifadagi o'nlab xatolar
bilan o'zgartiriladi. Bunday texnologiya faqat juda cheklangan miqdordagi
ilovalarda foydali bo'lishi mumkin.
Yana bir keng o'rganilgan vazifa qo'lda yozilgan matnni aniqlashdir .
Hozirgi vaqtda erishilgan aniqlik qo'lda yozilgan "bosma" matnga qaraganda ancha
past. Yuqori ballga faqat kontekstual va grammatik ma'lumotlardan foydalangan
holda erishish mumkin. Masalan, tanib olish jarayonida lug'atda butun so'zlarni
qidirish matndagi alohida belgilarni aniqlashga urinishdan ko'ra osonroqdir. Til
grammatikasini bilish so‘zning fe’l yoki ot ekanligini aniqlashga ham yordam
beradi. Alohida qo'lda yozilgan belgilarning shakllari ba'zan butun qo'lda yozilgan
matnni aniq tanib olish uchun etarli ma'lumotni o'z ichiga olmaydi (98% dan
ko'proq).
Dostları ilə paylaş: