1. Korpus va kompyuter lingvistikasining farqli jihatlari.
Kompyuter va korpus lingvistikasi bir-biriga o‘xshash va ba’zi hollarda bir xil degan noto‘g‘ri qarashlar uchrab turadi. XX asrning 90-yillari birinchi yarmida korpus tilshunosligi til to‘g‘risidagi fanning alohida qismi sifatida shakllandi. SHu bilan birga, u kompyuter tilshunosligi bilan yaqindan hamkorlik qiladi, uning yutuqlaridan foydalanadi va, o‘z navbatida, uni boyitadi.
Bir guruh olimlar korpus lingvistikasini kompyuter tilshunosligining tarkibiy qismi sifatida baholashadi: korpus tilshunosligi – kompyuter texnikasi yordamida tilshunoslik korpusini qurish va ulardan foydalanishning umumiy tamoyillarini ishlab chiqadigan birliklarni yaratiladigan kompyuter tilshunosligi. SHu bilan birga, odatda, kompyuter asbob-uskunalari, dasturlari, tashkilotning kompyuter texnologiyalari va ma’lumotlarini qayta ishlashning keng doirada ishlash mexanizmini modellashtirish tarzida tushuniladi.
Kompyuter tilshunosligi korpus tilshunosligi uchun vositalarni (ya’ni dasturlarni) yaratadi. SHu ma’noda ular bir-birini to‘ldiradilar. Masalan, korpus tilshunoslari korpusda so‘zlarni avtomatik tarzda belgilash uchun maxsus vositalarga muhtoj. Agar yuz milliondan ortiq foydalanadigan matn birligi mavjud bo‘lib, har bir so‘z uchun nutqning bir qismini belgilash kerak bo‘lsa, bu jarayonni to‘laligicha qo‘lda amalga oshirib bo‘lmaydi, shu bois tizimli dasturiy ta’minot talab qilinadi. Unga ko‘ra so‘zlarni tasnifiy belgilariga ko‘ra belgilash avtomatik ravishda amalga oshiriladi.
Kompyuter tilshunosligini qo‘llashning ayrim jihatlari quyidagilar:
avtomatik tarjima;
autentik va yarim-autentik matnlardan avtomatlashtirilgan ma’lumotlarni olish;
inson va mashina o‘rtasida qulay interfeyslarni yaratish;
tabiiy tillarda aloqaning kantitatif3 tavsifi.
SHu bilan birga, kompyuter tilshunosligi “odatda, kompyuter vositalari (dasturlari, ma’lumotlarni tashkil qilish va qayta ishlash uchun kompyuter texnologiyalari)ni muayyan sharoitlarda, vaziyatlarda, muammoli sohalarda va tillardagi modellarning ko‘lamini nafaqat tilshunoslikda, balki boshqa fanlarga ham qo‘llashni nazarda tutadi”[1.13]. Korpus tilshunosligi kompyuterni aniq vosita sifatida ishlatadi va ularsiz, albatta, u bajaradigan vazifalarni bajarolmaydi.
Korpus tilshunosligi o‘z materiallarini yaratadi, anirog‘i, uni mustaqil ravishda tuzadi. Bu esa, mustaqil tilshunoslikni o‘z ichiga oladi – u ishlatilgan og‘zaki materiallarning o‘ziga xos xususiyati va vositalari, ya’ni korpuslar tahlili uchun dasturlarga egadir. Ilm-fanning mustaqilligi tahlil materiallari yoki tadqiqot usullari mavjudligi bilan belgilanadi. Korpus tilshunosligi unisiga ham, bunisiga ham ega [4].
Korpus lingvistikasiga tilshunoslikning lisoniy korpuslar yaratish va ulardan foydalanishni o‘rganadigan bo‘limi sifatida qaraymiz va bu tanlab olingan matnlar asosida ifodalangan tillarni o‘rganish demakdir. Ba’zi olimlar esa korpus lingvistikasini kompyuter lingvistikasi qamrovidagi soha deya e’tirof etishadi: Korpus lingvistikasi – kompyuter lingvistikasi bo‘limi bo‘lib, kompyuter texnologiyalari yordamida til korpuslarini yaratish va qo‘llash muammolari bilan shug‘ullanadi. “Kompyuter lingvistikasi – kompyuter texnologiyalardan til faoliyatlarini modellashtirishda ma’lumotlar yig‘ish, saralash va keng ko‘lamda foydalanishdir. Ba’zi muammoli vaziyatlarga ko‘ra, tilning kompyuter modeli nafaqat tilshunoslikda, balki u bilan chambarchas bog‘liq bo‘lgan fanlarda ham qo‘llash nazarda tutiladi” [2].
A.N. Baranov ta’kidlaganidek, “kompyuter lingvistikasiga tilga asosiy urg‘u berilmasdan, balki eng so‘nggi o‘rinlarda e’tibor qaratilib, bunda tilning kompyuter modellashtiruvi tilshunoslik sohalaridagi programmalashtirishga oid texnik ta’minot nazariyalarigagina ahamiyat beriladi” [1]. Korpus lingvistikasi esa kompyuterlardan vosita sifatida foydalanadi. Tan olish kerakki, agar kompyuterlar bo‘lmaganida u hozirdagi faoliyatini amalga oshira olmas edi. Fanlarning taraqqiyoti natijasida korpus lingvistikasi barcha fanlarda tatbiq etiladi, lekin bu orqali ushbu fanlar kompyuter sohasi (computer science)ning bir qismi bo‘lib qolmaydi.
Zamonaviy tilshunoslikda har ikkala fanning o‘rganilish darajasi va mazkur sohalar bo‘yicha dunyo olimlarining izlanishlari va ilmiy qarashlariga tayangan holda kompyuter lingvistikasi korpus lingvistikasidan quyidagi xususiyatlariga ko‘ra keskin farqlanishi bo‘yicha xulosalar chiqarildi:
nomlanishidagi farq;
mazkur ikki sohaning belgilangan maqsadlari jihatidan:
a) kompyuter lingvistikasi tilga oid programmalarni ishlab chiqishni o‘z oldiga asosiy maqsad qilib qo‘yadi. Ta’kidlash joizki, bu bevosita tilshunoslik oldidagi muamolarni hal etishga qaratilmagan;
b) korpus lingvistikasi esa, fanning maqsadi sifatida mavjud tilning korpusini yaratish va uning yordamida tildagi so‘zlar, iboralar hamda boshqa lisoniy birliklarning qo‘llanilish chastotasini aniqlashni belgilab qo‘ygan. Bu esa korpus lingvistikasini aynan tilshunoslikka oid ekanligini ko‘rsatadi.
3) kompyuterning barcha fanlarda foydalanish o‘rni va ahamiyati tomonidan:
a) kompyuter lingvistikasida kompyuter qurilmalari asos bo‘lib, ushbu fandagi barcha izlanishlar kompyuterlar va ularning afzalliklarini oshirishga qaratiladi;
b) korpus lingvistikasi esa kompyuter qurilmalaridan faqatgina vosita sifatida foydalanadi, bunda matnlarni yig‘ish va saralash amaliyotlarini bevosita ular yordamida amalga oshiradi.
Har qanday yuksalayotgan fan o‘z amaliyotida kompyuterlar taraqqiyotining yutuqlaridan foydalanadi, lekin ushbu fanlar (korpus lingvistikasi, kompyuter lingvistikasi, kompyuter matematikasi, kompyuter fizikasi) kompyutershunoslikning bir qismi sifatida qabul qilinishi joiz emas. Mazkur fanlar tahlil ob’ektini tadqiq etishda kompyuterdan vosita sifatida foydalanadi, xolos.
YUqoridagi tahlillardan kelib chiqib, shuni aytish mumkinki, korpus lingvistikasi kompyuter lingvistikasining alohida bir qismi yoki bo‘limi emas. Ular yo‘nalish hamda tadqiqot ob’ekti, maqsad va muammolari turlicha bo‘lgan mustaqil fanlardir.
Dostları ilə paylaş: |