Umumiy tilshunoslik kafedrasi


Korpus lingvistikasining ob’ekt va predmeti



Yüklə 471,78 Kb.
səhifə25/64
tarix18.05.2023
ölçüsü471,78 Kb.
#116299
1   ...   21   22   23   24   25   26   27   28   ...   64
Umumiy tilshunoslik kafedrasi

2. Korpus lingvistikasining ob’ekt va predmeti.
Korpus lingvistikasi kompyuter texnologiyalari ѐrdamida lingvistik korpus (matnli korpus)ning qurilishi va undan foydalanishning umumiy tamoyillarini ishlab chiqish bilan shug‘ullanadi. Lingvistik korpus ѐki matnli korpus ostida o‘ziga xos til muammolarini hal qilish uchun yaratilgan katta hajmdagi mashinada o‘qiladigan, birlashtirilgan, ѐrliqlangan, formatlangan filologik jihatdan barkamol til ma’lumotlari to‘plami tushuniladi.
Korpus tilshunosligi atamasi birinchi marta 1977 yilda ishlatilgan, bu esa korpus tilshunosligini juda ѐsh ilmiy yo‘nalish deb atashga imkon beradi. Ammo shu qisqa vaqt ichida korpus tilshunosligi hisoblash tilshunosligining ѐndashuvlaridan biri sifatida zamonaviy tilshunoslikning etakchi yo‘nalishlaridan biriga aylandi. Rossiyada bu atama ingliz tilining halqaro korpusi asoschilaridan biri Sidney Grinbaumning ma’ruzalari tufayli faqat 1996 yilga kelib ma’lum bo‘ldi.
XX asrning 60 yillarida paydo bo‘lgan korpus tilshunosligi, nutq amaliѐti uchun yangi metodologik asosni, tadqiqotning ustuvor yo‘nalishlarini yaratdi. Korpus lingvistikasi metalingvistik vosita sifatida til metodologiyasini qurish, undan foydalanish va nutq naqshlarining lingvistik talqini – kompyuter vositalari ѐrdamida “eski” va “yangi” til muammolarini hal qilishda imkon yaratadi [2].
Jahon tilshunosligida kompyuter va korpus lingvistikasi muammolarini o‘rganish XX asrning 40 yillarida boshlanib, bu sohada dastlabki ilmiy farazlar aytildi. Xususan, o‘tgan asrning 60 yillarida mazkur jaraѐn jadallashdi, XXI asr boshlarida o‘zida millionlab so‘zlarni aks ettiruvchi yuzlab til korpuslari paydo bo‘ldi. Korpus tilshunosligi zamonaviy amaliy tilshunoslikning ustuvor yo‘nalishi hisoblanadi.
Korpus tilshunosligi zamonaviy kompyuter texnologiyalaridan foydalangan holda lingvistik ma’lumotlar korpuslari (matn korpuslari) qurishning umumiy tamoyillarini belgilaydi, ѐzma va og‘zaki matnlarning haqiqiy lingvistik hodisalarini tiplash metodologiyasini, shuningdek, ularni saqlash va tahlil qilish usullarini ishlab chiqadi. Matnli korpuslar bilan ishlash tadqiqotchini sub’ektivligidan ma’lum darajada mavhumlashtirishga va tilni ob’ektiv o‘rganishga imkon beradi [13].
Bugungi kunda korpus tilshunosligi ko‘pincha tilshunoslikda kompyuter va elektron korpusdan foydalangan holda “real haѐtda” tildan foydalanishni o‘rganishga nisbatan yangi ѐndashuv sifatida tushuniladi. Korpus tilshunosligi mustaqil intizom pozitsiyasini da’vo qilish uchun kamida ikkita xususiyatga ega:
1) ishlatilgan og‘zaki materialning tabiati;
2) vositalarning o‘ziga xos xususiyatlari.
Agar tilshunoslikning sintaksis, semantika va sotsiolingvistik bo‘limlari til tuzilishini ѐki lingvistik foydalanishni tavsiflashga ѐki baholashga qaratilgan bo‘lsa, korpus tilshunosligi kengroq tushuncha, lingvistik tadqiqotning ko‘plab jihatlarida qo‘llanilishi mumkin bo‘lgan metodologiya hisoblanadi. Korpus tilshunosligini ba’zida “tilshunoslik tadqiqotlarining turli sohalaridagi usullar to‘plami” deb atashadi [6].
Lingvistik tahlil usuli sifatida korpus tilshunosligi ularni qiѐsiy o‘rganish jaraѐnida umumiy va tillar, dialektlar ѐki til variantlari o‘rtasidagi alohida faktlarni aniqlashga qaratilgan qarama-qarshi tadqiqotlar bilan ham bog‘liqdir [5].
Lingvistik tahlilning ko‘plab turlari empirik ma’lumotlarning mustahkam va keng bazasida eng yaxshi ishlab chiqilgan. E.Finegan korpus tilshunosligini tuzish va undan foydalanish uchun zarur bo‘lgan va tilning tabiiy ishlatilishini o‘rganishga yo‘naltirilgan faoliyat sifatida belgilaydi [6]. Ushbu ta’rif korpus tilshunosligining ijodiy yo‘nalishini ta’kidlaydi.
Korpus tilshunosligining ikki tomonlama tabiati (matn korporasini yaratishda ham, foydalanishda ham diqqat markazida) uning ob’ektining ikki tomonlama tabiati bilan belgilanadi – bir tomondan korpus tilshunosligi va boshqa tomondan, bu korpus tilshunosligining mahsulidir.
XIX asr oxiri XX asrning boshlarida korpuslar lingvistik tadqiqotlar o‘tkazish uchun ѐki ko‘pincha amaliy muammolarni echish uchun (masalan, til birliklarining chastotasini hisoblash uchun) yaratila boshlandi. Korpus tilshunosligi uchun kompyuterlarning ixtiro qilinishi va keng qo‘llanilishi bilan rivojlanishning yangi bosqichi boshlanadi – yaratilgan korpuslar mavjudlaridan nafaqat saqlash formatida, balki hajmlarida ham farq qiladi [3].
Olim V.A.Plungyan o‘z vaqtida to‘g‘ri baho berganidek, endi tilni o‘rganish uchun odamga ikkita emas, uchta narsa kerak bo‘ladi: lug‘at, grammatika va ma’lum tildagi matnlarning korpusi. U lug‘at ham, grammatika ham, umuman olganda, ushbu yashash maydonidan tashqarida foydasizdir, chunki til aslida ishlaydi, deb ta’kidlaydi.
Lingvistik korpus – ma’lum prinsiplarga muvofiq, belgilangan (izohlangan), maxsus qidiruv tizimi tomonidan taqdim etilgan matnlar to‘plamining vakili.
Korpus tilshunosligi tor ma’noda faqat korpuslarni qanday yaratish va ulardan qanday foydalanish haqidagi ilmdir, ammo bu til ilmining yangi mafkurasi rolini ko‘proq talab qiladi [13].
Korpus bo‘yicha bildirilgan fikrlar, ilmiy nazariyalar xususida quyidagilarni umumlashtirib, qayd etish mumkin:  korpus – “til tanasi” deb ataladigan matnlar to‘plamining bir turi. Ammo oddiy matnlar to‘plamidan farq qiladi;  korpus – ma’lum bir tarzda tashkil etilgan og‘zaki birlik;  korpus – ma’lum bir tildan olingan shakldagi lingvistik ma’lumotlar to‘plami tahlili uchun mavjud bo‘lgan ѐzma so‘zlar ѐki matnlar;  korpus – istalgan tilda og‘zaki ѐzi ѐzma ravishda ѐzilgan tabiiy matnlar to‘plami.
Demak, korpus – so‘zlar, iboralar, grammatik shakllar va so‘z ma’nolari tizimlari. Bugungi globallashuv davrida har bir xalq, har qaysi mustaqil davlat o‘z milliy manfaatlarini ta’minlash, bu borada, avvalo, o‘z madaniyatini, azaliy qadriyatlarini, ona tilini asrab-avaylash va rivojlantirish masalasiga ustuvor ahamiyat qaratishi tabiiydir.
Korpus lingvistikasi rivojlantirilsa, sun’iy intellektning o‘zbek tilini “tushunish, o‘qiy olish, qayta tahrirlash, unga mos javob qaytarish”ini ta’minlaydigan dasturlar yaratiladi (bu tilshunos va dasturchilar hamkorligidagi amalga oshiriladigan dolzarb vazifa). Agar o‘zbek tili korpusi yaratilsa, “Google”da o‘zbek tilida qidiruv tizimi paydo bo‘ladi. Onlayn tarjima (internet tarjima) ѐki avtomatik tarjima dasturlari rivojlantiriladi. Bu orqali esa o‘zbek tilining turli elektron lug‘atlarini yaratish imkoniyati kengayadi, tilni dunѐ sahnasiga olib chiqish imkoniyati kengayadi.

Yüklə 471,78 Kb.

Dostları ilə paylaş:
1   ...   21   22   23   24   25   26   27   28   ...   64




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin