Alisher Navoiy nomidagi Toshkent
davlat o„zbek tili va adabiyoti
universiteti
“KOMPYUTER LINGVISTIKASI:
MUAMMOLAR, YECHIM, ISTIQBOLLAR”
Respublika I ilmiy-texnikaviy konferensiya
Vol. 1
№. 01 (2021)
http://compling.navoiy-uni.uz/
100
guruhga bo'lish kerak: hujjatlarni to'g'rilash va ma'lumot olish. Birinchisi, kirish va
chiqishda matnli hujjat bo'lishini nazarda tutadi (xatolarni tuzatish, matnni tuzatish,
uning tuzilishini aniqlash, umumlashtirish, mashinaga tarjima qilish vazifalari).
Ikkinchi kichik guruhga rasmiy ravishda taqdim etilgan ma'noni qayta ishlash bilan
bog'liq vazifalar kiradi: faktlarni yig'ish, tabiiy tilda so'rovlarni bajarish, tabiiy til
interfeyslarini tashkil etish va to'g'ri matnlarni yaratish. Birinchi kichik guruhning
barcha vazifalarini amalga oshirish yoki mutaxassislar tomonidan tuzilgan
qoidalarga yoki mashinada o'qitish usullarini qo'llash natijasida olingan
namunalarga asoslanishi mumkin. Qoidalar tizimidan foydalanish aniqroq va
bashorat qilinadigan natijalarni berishi mumkin, ammo uni yaratish uchun yuqori
xarajatlarni nazarda tutadi. O'z navbatida, mashinada o'qitish usullarini qo'llash
unchalik mashaqqatli emas, balki juda ko'p sonli yuqori sifatli misollarni talab
qiladi. Aytaylik, siz boshqa ko'plab Evropa tillari va ingliz tilidagi matnlarini
tarjimalarni qilishimiz mumkin, ammo nodir tillarga tarjima namunalarini topish
qiyin. Alohida hujjatlarni qayta ishlash bo'yicha vazifalarning ikkinchi kichik
guruhiga ma'lumot olish, tabiiy tilda so'rovlarni bajarish, matnlarni yaratish va
tabiiy til interfeyslarini tashkil etish kiradi. Ushbu vazifalarning barchasi matnlarni
"tushunish" va ko'rsatilgan faktlarni topishni o'z ichiga oladi. Ish ma'lumotlar
yig'ish qoidalari tizimi asosida amalga oshiriladi, ularning har biri sintaktik tuzilish
shablonini va rasmiylashtirilgan axborot taqdimotining yaratilgan bo'lagi uchun
shablonni belgilaydi. Hujjatni qayta ishlashda sintaktik tahlil natijalari ko'rib
chiqiladi va parchalari qidirilmoqda, uning tuzilmasi informatsiyadan chiqarib
olish qoidalaridan andozalarga mos keladi. Keyingi, "Ishladi" qoidalariga muvofiq
so'zlarning bir qismi matndan olinadi va rasmiy tuzilishga aylantiriladi. Matnni
"tushunish" vazifasidan asosiy farq shundaki, u belgilangan predmet sohasidagi
ma'lumotlar bilan ishlaydi, buning uchun ma'lumotlar kontseptual modeli va ajratib
olish qoidalari aniq belgilangan. Tabiiy til interfeyslarini tashkil qilish IBM
Watson tizimida birdaniga echilgan uchta vazifaning kombinatsiyasi sifatida
qaralishi mumkin: ma'lumot olish, bilim bazasi darajasida javob izlash va matn
yaratish. Ushbu texnologiyalar qanday talabga javob berishini aytish hali ham
qiyin, ammo tizimdan tibbiy diagnostika uchun foydalanish rejalashtirilgan, ammo
tabiiy til interfeysi ekspert tizimlari bilan o'zaro aloqaning boshqa usullaridan ko'ra
qulayroq bo'lishi aniq emas.
Dostları ilə paylaş: