Grafematik tahrir bosqichida matndagi xatboshi, raqam, punktuatsion va
boshqa ramziy belgilar aniqlanadi, ya’ni so‘z va so‘zshakllarga qadar
tekshiruvni amalga oshiradi. Grafematik tahrir bosqichining maqsadi –
matndagi eng kichik birliklarni ham aniqlash va tasniflashdan iborat. Bunday
birliklarga quyidagilar kiradi: so‘z, xatboshi, tinish belgilari, sanalar, pul
birliklarining ramzlari, so‘z-raqamli birikmalar, sonlar, IP-manzillar va fayl
nomlari, telefon raqamlari. Grafematik tahrir ko‘p bosqichli tahrir qilish
dasturining ilk bosqichi hisoblanib, u keyingi bosqichlarning to‘laqonli va
samarali bo‘lishi uchun asos yaratadi.
Morfologik tahrir bosqichi asos va shu asosdan yuzaga kelgan
so‘zshakllarni tekshiradi. Morfologik tahrirning maqsadi – faqat orfografik
xatolarni tekshirishdan iborat, deb hisoblash uning vazifa ko‘lamini
toraytiradi. Ushbu bosqichda kiritlayotgan so‘zshaklning qanday asosiy
shakldan qaysi lingvistk parametrlardan yuzaga kelganini aniqlaydi. Bu
keyinchalik bir so‘zning barcha shakllari ustida ishlashga emas, balki asosiy
shaklning qanday lingvistik parametrlarni olish imkoniyatiga egaligi ustida
ish olib borishga turtki beradi. Masalan, ot turkumidagi kitob so‘zining
qanday shakl hosil qiluvchi va sintaktik shakl yasovchi qo‘shimchalarni
qabul qilishi hamda ularning kombinatsiyasini biriktirib, so‘zshakllarni hosil
qilish imkoniyati, ya’ni parametrlari dasturning bazasiga kiritiladi. Natijada
kitobso‘zining barcha shakllari kiritilib, dastur ta’minotidan katta hajm
egallanmaydi, balki asosiy shakl va unga birikishi me’yoriy hisoblangan
lingvistik parametrlar kiritilib, hajm iqtisod qilinadi.
Sintaktik tahlilbosqichi – matn tahririning eng qiyin bosqichi. Uning
asosiy vazifasi so‘zlarning o‘rnini va ularning o‘zaro birikishini aniqlash
hisoblanadi. Shu bois ushbu bosqichni tahrir bosqichi deb emas, balki
lingvistik tahlil bosqichi, deyish mumkin. Bir so‘zshakl bir qancha so‘zning
grammatik shakliga to‘g‘ri kelishi mumkin. Bunday hollarda so‘zlarni farqlash
37
uchun matn kiritiluvchiga shunday so‘zlar varianti ko‘rsatiladi va matn
teruvchi so‘zlardan muvofig‘ini tanlab qo‘yadi. Ushbu jarayon morfologik
tahrirda ham kuzatiladi. Ya’ni so‘zning xato yozilgani aniqlangach, matn
teruvchiga tanlab qo‘yish imkonini beruvchi so‘zlar variantini taklif etadi.
Sintaktik tahlilda asosiy maqsad so‘zlarning asosiy maqsad so‘zlarning o‘zaro
bog‘lanish me’yorlarini e’tiborga olishdir.
Matnlarni grammatik tahrir qilishda (Grammar checking) kompyuterga
kiritilayotgan matndagi gap strukturasining grammatik jihatdan to‘g‘ri
tuzilganligini tekshiradi. Buning uchun dasturga gaplarning kombinatsiyalarini
kiritish talab etiladi. Shunda gapni dastur kiritilgan ko‘plab me’yoriy
kombinatsiyalar doirasida tekshiradi. Agar gap tuzilish kombinatsiyalariga
muvofiq kelmasa, dastur uni xato deb hisoblaydi va foydalanuvchiga bu
haqda xabar beradi. Grammar checking dasturida faqat grammatik me’yorlar
emas, balki semantika, so‘zlarning ma’nosi hamda mantiqiyligiga ham e’tibor
beriladi. Masalan, Qush uchmoqda. Odam uchmoqda. Devor uchmoqda gaplari
Grammatik jihatdan to‘g‘ri yozilgan, ya’ni ega+kesim munosabati mavjud (III
shaxs, birlik). Ammo semantikasiga e’tibor bersak, gaplar xato tuzilgan. Chunki
odamning qanoti yo‘q, faqat badiiy matndagina insonning uchishi uchishi
haqida yozish mumkin. Matnlarni kompyuter vositasida qayta ishlashda ilmiy,
rasmiy-idoraviy, axborot doirasidagi matnlar ham e’tiborga olinadi
17
.Keltirilgan
devor uchmoqda gapining semantikasi esa noto‘g‘ri va gap hech bir uslubga
mos kelmaydi. Chunki devor muqim bir joyda turuvchi, binoning, uyning
tomini ko‘tarib turuvchi yoki xonalarga ajratuvchi tik ko‘tarilgan qismi
18
.
Matnlarni semantik tahlil qilish bosqichida tushunchaga ega so‘zning
o‘rinli qo‘llanilayotgani tekshirib boriladi. Buning uchun dastur ta’minotiga
tezaurus lug‘atlarni kiritish talab qilinadi. Tezaurus ( yunoncha thesaurus –
xazina, boylik) lug‘atning o‘ziga xos maxsus ko‘rinishi bo‘lib, unda lug‘aviy
17
Абжалова М.А. Ўзбек тилидаги матнларни автоматик таҳрирлашда услуб масаласи// Таълим
тизимидаги ижтимоий-гуманитар фанлар, №2, Т.: 2013, 141-145-бетлар.
18
Қаранг: Ўзбек тилининг изоҳли луғати. 1-жилд. Т., 2006., 588-б.
38
birliklar o‘rtasida semantik munosabat (sinonimlar, antonimlar, paronimlar,
giponimlar, giperonimlar va boshqalar) ko‘rsatilgan bo‘ladi.
Zamonaviy texnologiyalarning kundalik turmushimizda muhim o‘rin
egallashi va ilm-fanning rivojlanishi avtomatik tahrir va tahlilning
ahamiyatini oshirmoqda. Avtomatik tahlil faqat matnlardagi mexanik xatolarni
bartaraf etibgina qolmay, matnning savodli yozilishini ham ta’minlaydi, matn
kirituvchiga jumlada xato so‘z borligi haqida xabar berib, uni xatoni bartaraf
etishga undaydi, natijada to‘liq lingvistik me’yorlar darajasidagi matnni yuzaga
keltirishda vaqt tejaladi.
Bunday imkoniyatga erishish uchun, albatta, o‘zbek tili asosida ko‘p
bosqichli avtomatik tahrir dasturining lingvistik ta’minotini mukammal
darajada ishlab chiqish talab etiladi.
Dostları ilə paylaş: |