OCR dasturlari bilan ishlashdan qanday foyda olasiz?
Yuqori sifatli matnni aniqlash texnologiyasi ABBYY OCR qog'oz hujjatlarni (skanerlar, fotosuratlar) va har qanday turdagi PDF hujjatlarini tahrirlanadigan formatlarga aniq konvertatsiya qilishni ta'minlaydi. Zamonaviy OCR texnologiyalaridan foydalanish har qanday hujjatlar bilan ishlashda ko'p vaqt va kuchni tejash imkonini beradi. ABBYY FineReader OCR yordamida siz qog'oz hujjatlarni skanerlashingiz va ularni tahrirlashingiz mumkin. Siz kitoblar va jurnallardan iqtiboslarni ajratib olishingiz va ularni qayta yozmasdan foydalanishingiz mumkin. Raqamli kamera va ABBYY FineReader OCR yordamida siz qo'lingizda skaner bo'lmaganda o'zingiz ko'rgan afisha, banner, hujjat yoki kitobni bir zumda suratga olishingiz va natijada olingan tasvirni tanib olishingiz mumkin. Bundan tashqari, ABBYY FineReader OCR dan PDF hujjatlarining izlanadigan arxivini yaratish uchun foydalanish mumkin.
Qog'oz hujjat, fotosurat yoki PDF dan butun o'zgartirish jarayoni bir daqiqadan kamroq vaqtni oladi va tan olingan hujjatning o'zi asl nusxaga o'xshaydi!
Optik belgilarni aniqlash (OCR) tizimlari kompyuterga kiritish, qog'oz va elektron hujjatlarni saqlash va qayta ishlashni qo'llab-quvvatlovchi integratsiyalashgan paketlarning ajralmas qismiga aylandi. Tizim ma'lumotlarni kiritish uchun skanerni o'z ichiga oladi.
Agar skaner tomonidan yaratilgan tasvir matn va rasmlarni o'z ichiga olsa, undan foydalaning maxsus dastur Optik belgilarni aniqlash (OCR) quyidagilar bo'lishi mumkin:
Dasturiy ta'minot zamonaviy tizimlar OCR harflar shaklini tahlil qiladi va matn faylini yaratadi, unda tan olingan matn so'zlar va jumlalarning ketma-ket shakllanishi bilan belgilar bo'yicha yoziladi.
OCR paketlarining ikki turi mavjud: o'rgatiladigan va aqlli. Birinchi optik belgilarni aniqlash paketlari turlari bo'yicha aniq ajratishga ega edi. So'nggi paytlarda ushbu ikki turni bitta paketda birlashtirish tendentsiyasi kuzatildi, bu esa tubdan yangi tan olish algoritmlarini ishlab chiqishga urinishlarni aks ettiradi.
O'rgatiladigan OCR dasturiy ta'minot paketlari dastlabki ishlanmalarning ko'p qismini tashkil etdi. Bunday paketlar nazariy jihatdan har qanday shriftdagi har qanday belgilarni tan olishni o'rganishga qodir. Dasturni ma'lum bir minigarnituraga o'rgatish uchun siz har bir aniq belgi uchun keyingi trening bilan mos yozuvlar tasvirini skanerlashingiz kerak. Bu juda uzoq protsedura, ammo agar ushbu minigarnitura muntazam ravishda ishlatilsa, bir necha soat o'rganishga arziydi. Ushbu turdagi dastur sahifadagi har bir alohida belgini o'quv jarayonida yaratilgan qidirish jadvallaridagi belgilar bilan solishtirib, matn faylini yaratadi.
OCR aqlli paketlari o'qitishni talab qilmaydi va ishlatilgan shriftdan qat'i nazar, belgilar shakllarini sharhlashi mumkin. Ushbu dasturlarning ishi ajoyib taassurot qoldiradi: hujjat skaner orqali o'tkaziladi, natija matnli faylni chiqarish bilan intellektual OCR dasturi tomonidan qayta ishlanadi. A4 sahifasi uchun butun protsedura bir daqiqadan ko'proq vaqtni oladi. Yuqori aniqlik bilan bu qo'lda kiritishdan ancha tezroq.
FineReader - skaner yordamida olingan grafik tasvirni (rasm) matnga (ya'ni tizim tushunadigan harf kodlariga) o'zgartiruvchi belgilarni optik aniqlash (OCR) tizimi.
Matnlarni kompyuterga kiritish jarayoni bir necha bosqichda amalga oshiriladi: skanerlash; tasvirdagi bloklarni tanlash; tan olish; xatolarni tekshirish; tanib olish natijasini saqlash (uni boshqa dasturga, buferga o'tkazish va h.k.)
Shakl 2. Interfeys FineReader dasturi 11
Cuneiformning aqlli optik belgilarni aniqlash (OCR) tizimi muhitda ishlaydi. Microsoft Windows 3.1 yoki keyinroq. Tizim quyidagi texnologik imkoniyatlarga ega: ish stoli skanerlarining keng doirasini qo‘llab-quvvatlaydi, skanerlangan sahifani (shu jumladan, ko‘p ustunli matn va murakkab dizayndagi matnni) taniydi; tasvirni TIFF sifatida skanerlash va yozib olish va tanib olishni keyinroq boshlash imkonini beradi (hujjatlar to'plamini skanerlash qulay); boshqa dasturlar va fakslar tomonidan skanerlangan tasvirlarni Nozik va Oddiy rejimlarda o‘qiy oladi; rus va ingliz alifbosidagi harflarni taniydi, gotik harflar kabi stilize qilingan shriftlardan tashqari; asl formatlash va yorliqlarni saqlab qolishi hamda chekinish va hizalanishni sozlashi mumkin; qo'lda yozilgan matnni tanimaydi.
Chizma ekrani rasmda ko'rsatilganidek, to'rtta asosiy qismdan iborat.
Shakl 3. Suneiform dasturining interfeysi
Windows tanib olish tizimi uchun Intuitia 2.0 ning yangi versiyasi Omnifont texnologiyasidan foydalanadi (har xil shriftlarni hech qanday ta'limsiz taniydi). U fayllardagi matnli materiallar tasvirlarini tanib olishni ta'minlaydi TIFF formatlari, PCX, BMP, shuningdek, barcha TWAIN skanerlaridan, shuningdek, HP ScanJet oilasi skanerlaridan (to'g'ridan-to'g'ri).
PenO "Man for Windows" qo'l yozuvini kiritish va aniqlash tizimi - vosita qo'l yozuvi, stilus yordamida matnlarni tanib olish va tahrirlash: ingliz va rus tilidagi birlashtirilgan matnni hamma joyda kiritish va tahrirlash mumkin Windows ilovalari; kiritish jarayoni chapdan o'ngga yozishda odatdagi qalamdan foydalanishga o'xshaydi, yaxshisi klassik chapga egilgan toza qo'l yozuvida; foydalanish natijasida allaqachon kiritilgan matnni tahrirlash mumkin standart funktsiyalar(qo'shish, o'chirish, uzatish, matn qismlarini faollashtirish va boshqalar), shuningdek qalamning oddiy zarbalari.
Dostları ilə paylaş: |