Kompyuter lingvistikasida modellashtirish va analogiya metodlari
2.4. Tilni anologiya metodi asosida formallashtirish. Kompyuter lingvistikasida eng ko‘p qo‘llanilayotgan metodlardan biri analogiya metodi hisoblanadi. Analogiya (yunoncha so‘zdan olingan, «moslik», «o‘xshashlik» ma’nosini anglatadi) - munosabatlarning tengligi, muvofiqligi; hodisa va jarayonlarning muayyan xossalarini qiyos- lash yo‘li bilan anglashda o‘xshash jihatlari. Qiyoslanayotgan obyektlar o‘rtasida o‘xshashlik va farqlanish kuzatiladi, bu qiyoslashning asosi sanaladi. Bunda ma’lum obyektga xos bo‘lgan aniq belgining qiyoslanayotgan obyektlarda kuzatilishiga tayanib ularning identifikatsiyasi asosida mush- tarak jihati aniqlanadi. Masalan, sifat va ravish so‘z turkumiga mansub so‘zlar berildi. Ular bir qarashda bir-biriga juda yaqin, so‘roqlari o‘xshash, shuningdek, farqli tomonlari ham mavjud. Shunda analogiyaga tayanib berilgan so‘zlarning mushtarak jihatlarini ajratish mumkin. Yoki ko‘p odamlar «singan oyna - baxtsizlik, noxitsh voqealarni keltirib chiqaradi», degan irimga ishonadi. Bu irimning kelib chiqishi ham qandaydir mistik asosga ega emas, balki analogiyaga asoslangan. Ya’ni singan oyna insonni xunuk aks ettiradi, mazkur tashqi o‘xshashlik asosida tasvirning buzilishi undan foydalanuvchi uchun ham shunga mos yomon oqibatlarni keltirib chiqaradi, degan xulosaga olib kelgan. Shu o‘rinda ta’kidlash joizki, analogiya induksiya (umumiylikdan xususiylikka borish; qoidadan misolga borish) va deduksiya (xususiylikdan umumiylikka borish; misoldan qoidaga borish) metodlari bilan uzviy aloqadorlikda boladi. Bilish jarayonida ular o‘rtasiga qat’iy chegara qo‘yib bo‘lmaydi. Analogiya deduksiya va induksiya o‘rtasida bogiovchi «halqa» vazifasini o‘taydi.
Bilishda analogiya metodining ahamiyatini mashhur matematik Dyord Poya shunday izohlaydi: «Analogiyaga asoslanmasdan na elementar, na oliy matematikada, na fanning boshqa sohalarida hech qanday kashfiyot qilib bo‘lmaydi». Stefan Banax esa shunday yozadi: «Matematik isbotlar o‘rtasidagi analogiyani topa olgan odam, eng yaxshi matematik - isbotlar o‘rtasida analogiya о’rnata olgan odam, bandan ham ко’ra kuclili matematik - nazariyalar analogiyasini sezgan odam; biroq odam o‘zini eng kuchli hisoblashi uchun analogiyalar o‘rtasidagi analogiyani ko‘ra olishi kerak». Ushbu mulohazalardan kelib chiqqan holda aytish mumkinki, analogiya lingvistikadagi, xususan, kompyuter lingvistikasidagi tadqiqotlar uchun ham o‘ziga xos «kompas» vazifasini bajaradi.
Akademik L.V.Sherba o‘zining bir ma’ruzasida yozuv taxtasiga shunday jumlani yozadi: «Глокая куздра штеко будланула бокра и кудрячит бокренка». Talabalardan uning grammatik tahlilini talab qiladi. Mazkur jumla aslida hech qanday mazmunga ega emas, lekin u rus tilidagi mazmun- ga ega boigan qaysidir jumlani eslatadi. Bu jumlaning grammatik tahlilini amalga oshirish mumkin. Masalan, «куздра» so‘zi - birlik, bosh kelishik, jenskiy rod shaklidagi ot bilan ifodalangan ega, «будланула» so‘zi - o‘tgan zamon shaklidagi fe’l bilan ifodalangan kesimlardan biri, «кудрячит» so‘zi noaniq shakldagi fe’l bilan ifodalangan boshqa bir kesim. Masalaga bun- day yondashish analogiya metodi asosida bo‘ladi. Mazkur yondashuv, ay- niqsa, kompyuter lingvistikasidagi matnning avtomatik analizi yo‘nalishida muhim ahamiyat kasb etadi. Bunda so‘zlarning grammatik tavsifi va so‘zlarning oxiridagi harf tarkibi o‘rtasidagi kuchli korrelatsion aloqaga tayaniladi.1 Ya’ni oxirgi harf tarkibi bir xil bo‘lgan so‘zlarning derivatsion va relatsion modellari (so‘z yasalishi va shakl yasalishi) hamda grammatik ma’lumotlari (qaysi so‘z turkumiga mansubligi, qanday grammatik kate- goriyalarga egaligi) bir xil boiishi tabiiy. Masalan, ingliz tilida -er, -ness, - dom kabi, rus tilida -пость, -щик, -ник kabi, o‘zbek tilida -shunos, -chi, -lik qo‘shimchalarga ega bo‘lgan so‘zlar yuqori ehtimollik bilan ot (noun) so‘z turkumi hisoblanadi. Demak, tezaurusda (lug‘at bazasida) mavjud bo‘lmagan so‘zlarning avtomatik analizini mavjud bo‘lganlarining harf tarkibidagi moslikdan, so‘zlar analogiyasidan kelib chiqqan holda amalga oshirish mumkin. Bu jarayonda tizimning lingvistik ta’minoti chappa (ters) lug‘atlar bilan ham to‘ldirilgan bo‘lishi lozim.
XULOSA Ma’lumki, XXI asr kompyuter texnologiyalari, ilg‘or pedagogika va axborot texnologiyalari, yuksak tafakkur, fan va texnikaning jadal taraqqiyot asri bo‘ladi. XXI asr boshiga kelib, “Elektron ta’lim”, “Elektron boshqaruv”, “Ochiq ta’lim”, “Masofaviy ta’lim”, “Axborotlashgan ta’lim” kabi tushunchalar hayotimizga kundan-kun singib bormoqda. Prezidentimiz I.A.Karimov so‘zlari bilan aytganda, “hozirgi axborot, kommunikatsiya, kompyuter texnologiyalari asrida, internet kundan-kunga hayotimizning barcha jabhalariga tobora chuqur va keng kirib borayotgan bir paytda, odamlarning ongi va tafakkuri uchun kurash hal qiluvchi ahamiyat kasb etayotgan bir vaziyatda bu masalalarning jamiyatimiz uchun naqadar dolzarb va ustuvor bo‘lib borayotgani haqida gapirib o‘tirishga hojat yo‘q”1.
Hozirgi paytda injenerlik lingvistikasi, hisoblash lingvistikasi, matematik lingvistika va “elektron - tarjimon”, kompyuter lingvistikasi yuzasidan bir qator yangi muammolar o‘rtaga tashlanmoqda. Darhaqiqat, zamonaviy kompyuter juda ulkan imkoniyatlarga egaki, uning uchun shaxmat o‘ynashdan tortib, tibbiy tashxis qo‘yish, korxonalarni boshqarish, qadimgi xalqlarning sirli xatlarini “o‘qib”, mazmunini so‘zlab berish, she’r yozish, kuylar ijro etish, katta hajmdagi kitoblarga annotatsiyalar yozish, loyihalar tarxini chizish kabi yuzlab mehnat faoliyati turlarining barchasida, albatta, zamonaviy kompyuter texnologiyalari ham ishchi kuchi, ham vaqt jihatidan juda yaqin yordamchi sanaladi.
Bunlay ilmiy tadqiqotlar sirasiga murakkabligi, dolzarbligi bilan xarakterlanuvchi kompyuter lingvistikasi fani ham kiradi. Kompyuter lingvistikasi oldida turuvchi eng muhim masalalar quyidagilar:
- tilning aksiomatik nazariyasini ishlab chiqish;
- formal grammatika yaratish;
- tillarning matematik modellarini ishlab chiqish.1 Keyingi yillarda mamlakatimizda Kompyuter lingvistikasi muammolariga oid ishlar yaratildi. Bu o‘rinda S.Muxamedov va R.G.Piotrovskiy2, A.K.Po‘latov3, S.Muxamedova4, S.Rizayev5 kabi olimlarning ishlarini alohida ta’kidlash lozim.
So‘nggi yillarda A.Raximovning6 va A.K.Po‘latovlarning7 kompyuter lingvistikasiga bag‘ishlangan fundamental asarlari nashrdan chiqdi. Bu asarlarda fanning eng asosiy tushunchalari, yo‘nalishlari atroflicha yoritilgan.
Yuqorida aytilgan asarlar va tadqiqot ishlarida modellashtirishga alohida urg‘u beriladi va kompyuter lingvistikasi fanida tilni tekshirishning eng asosiy metodi ekanligi atroflicha yoritib beriladi.
Hozirgi kunda amaliy tilshunoslikning o‘zbek tilini tatbiqiy tadqiq etishning metodologik asoslari ishlab chiqish, metod va prinsiplari belgilash muhim masala. O‘zbek tilining tatbiqiy yo‘nalishlarini amalga oshirishning dasturi ishlab chiqilishi lozim. Unda amaliy tilshunoslik taraqqiyoti uchun dolzarb bo‘lgan quyidagi muammolarning hal etilishi ko‘zda tutiladi:
- tilshunoslikning sof nazariy fan doirasidan chiqib, iqtisodiy samarador yo‘nalishlar taraqqiy topgan fan mavqeini ham olishida zaruriy tadqiqotlar metodologiyasi va metodlari belgilab berish;
- amaliy tilshunoslikning bugungi ijtimoiy-iqtisodiy taraqqiyot davri uchun ayniqsa dolzarb bo‘lgan ustuvor yo‘nalishlari belgilash va asoslash;
- ishlab chiqilgan metodlar va metodologiya asosida muayyan amaliy yo‘nalish tavsifini yaratish.
Fanlar hamisha o‘zaro uzviy bog‘liqlik va hamkorlikda ish ko‘radi, ular bir-birisiz yashay olmaydi. Jumladan, kompyuter lingvistikasi fani ham bundan mustasno emas. Kompyuter lingvistikasi mantiq, informatika, statistika, semiotika, kibernetika, ehtimollar nazariyasi kabi turli fan sohalari bilan o‘zaro aloqadorlikda ish ko‘radi.
Model (lotincha «modelus» so‘zidan olingan bo‘lib, «nusxa», «andaza», «o‘lchov», «meyor» ma’nolarini anglatadi) tabiiy fanlar yoki umuman fanda shunday moddiy qurilma, grafik, sxema, umuraan, bilish vositasi sifatida tushuniladiki, u muayyan original-obekt haqidagi ma’lumotlar majmui tarzida yuzaga kelgan hosila-obekt demakdir. Boshqacharoq tushuntirganda, model tabiiy obektlarning imitatsiyasidir (o‘xshashi, taqlidiy ko‘rinishi), u o‘zbek tilidagi qolip, andaza so‘zlariga mos keladi. U hodisalarning yuzaga kelishi uchun asos vazifasini o‘taydi, bunda aniq yoki mavhum obektlar kichraytirilgan obektlar, sxemalar, chizmalar, fizikaviy konstruksiyalarda tadqiq etiladi.
Modellarni shartli ravishda quyidagicha tasniflash mumkin:
Tabiiy modellar - o‘rganilayotgan obekt bilan bir turda bo‘ladi va undan faqat oMchamlari, jarayonlarining tezligi va ba’zi hollarda yasalgan materiali bilan farq qiladi.
Matematik modellar - prototipdan (asl nusxadan) jismoniy tuzilishi bilan farq qiladi, lekin prototip bilan bir xil matematik tasvirga ega boMadi.
Mantiqiy-matematik modellar - belgilardan iborat bo‘lib, abstrakt model hisoblanadi va tafakkur jarayonini o‘rganishda qo‘llaniladi.
Kompyuterli modellar - matematik va mantiqiy modellashtirish metodlariga asoslanib kompyuterda algoritm va dasturlardan foydalanib yaratiladigan modellar.
Lingvistik model tushunchasi struktur tilshunoslikning E.Sepir, L.Blumfild, R.Yakobson, N.Chomskiy, Z.Harris, Ch.Hokket kabi namoyandalari tomonidan kirib kelgan. Uning taraqqiyoti esa XX asrning 60 - 70- yillariga (matematik va kibernetik lingvistika rivojlana boshlagan davrga) to‘g‘ri keladi. Lingvistik modelni quyidagi turlarga ajratish mumkin:
Inson nutqiy faoliyati modellari. Bu modellar konkret nutq jarayonini va hodisalarini aks ettiradi. Masalan, aniq bir tovushning talaffuz modeli yoki nutqning yuzaga chiqish modeli.
Lingvistik tadqiqot modellari. Bunda muayyan til hodisalari asosida olib borilgan tadqiqot jarayonini aks ettiradi. Masalan, o‘zbek tilida morfologik usul asosida so‘z yasalishining umumiy modeli: asos + so‘z yasovchi qo‘shimcha; xususiy modellari: asos + -chi; asos + -dosh; asos + -do‘z kabi.
Metamodellar - bunda lingvistik modellar saralanadi, u gipotetik- deduktiv xarakterga ega, o‘ta abstraktlashgan va ratsionallashgan bo‘ladi.