ADABIYOTLAR TAHLILI VA METODOLOGIYA
XX asrning 90-yillari birinchi yarmida korpus tilshunosligi til to'g'risidagi
fanning alohida qismi sifatida shakllandi. Shu bilan birga, u kompyuter tilshunosligi
ACADEMIC RESEARCH IN EDUCATIONAL SCIENCES
VOLUME 2 | ISSUE 9 | 2021
ISSN: 2181-1385
Scientific Journal Impact Factor (SJIF) 2021: 5.723
Directory Indexing of International Research Journals-CiteFactor 2020-21: 0.89
DOI: 10.24412/2181-1385-2021-9-515-522
Academic Research, Uzbekistan 516 www.ares.uz
bilan yaqindan hamkorlik qiladi,uning yutuqlaridan foydalanadi va, o'z navbatida, uni
boyitadi.1950 –yillarning oxiridan boshlab korpus tilshunosligi bo'yicha muhim
ishlar olib borildi, shu jumladan 1959 yilda asos solingan Randolf Kuirkning ingliz
tilidan foydalanish tadqiqotlari bo'limi va 1964 yilda nashr etilgan Frensis va
Kucheraning Brown korpusi kabi muhim ishlarni ko’rishimiz mumkin.
Korpus tilshunosligi – hisoblash tilshunosligining bir qismi bo'lib, u kompyuter
texnologiyalaridan foydalangan holda lingvistik korpuslarni (matn korpuslari) qurish
va ishlatishning umumiy tamoyillarini ishlab chiqadi. Matnlarning lingvistik yoki til
korpusi deganda, muayyan til muammolarini hal qilish uchun mo'ljallangan,
mashinada o'qiladigan, birlashtirilgan, tuzilgan, belgilangan, filologik jihatdan
mukammal lingvistik ma'lumotlar to'plami tushuniladi.
Korpus turlariga ixtisoslashgan, ma'lumotli, ko'p tili, parallel, o’rganish, qiyosiy,
diaxronik va monitor kiradi. Parallellik mezoniga ko'ra korpuslar bir tili, ikki tili va
ko'p tiliga bo'linadi. Bir tili korpuslarda dialektlar va til variantlariga qarama -qarshi.
Masalan, ingliz tili ona tili va ingliz tili chet tili kabi yangi texnologiyalar paydo
bo'lgunga qadar ilmiy qiziqish doirasidan tashqarida qoldi, bu esa qarama-qarshi
tildagi nutq asarlarini ancha ko'p jalb qilishga imkon berdi. Ikki tili va ko'p tili
korpuslar bir xil tematik sohadagi mustaqil ravishda ikki yoki undan ortiq tillarda
yozilgan matnlarni birlashtiradi (masalan, turli mamlakatlarda va turli tillarda
o'tkazilgan ma'lum bir ilmiy muammo bo'yicha konferentsiyalar materiallari
to'plami). Bunday korpuslar terminologiyaga yordam beradi va ko'pincha tarjimonlar
tomonidan ishlatiladi. Ikki tili yoki ko'p tili korpusning yana bir varianti-har qanday
manba tilida yozilgan asl matnlar va bu manba matnlarning bir yoki bir nechta
boshqa tillarga tarjimasi kiradi. Bunday korpus qiyosiy tadqiqotlar, tarjima nazariyasi
bo'yicha tadqiqotlar va inson va kompyuter tarjimasini o'rgatish uchun bebaho
material bo’lib xizmat qiladi.
Parallel matn korpusi - lingvistik manbalarning nisbatan yangi turi. Birinchi
Parallel korpus matn (PKM)lar - Shveytsariyada nemis, frantsuz va italyan tillarida
to'plangan qor ko'chkisi to'g'risidagi hisobotlar, Kanada ommaviy axborot
vositalarida ingliz va frantsuz tillaridagi ob-havo ma'lumoti - juda qattiq sintaksisga
ega bo'lgan maxsus pastki tillarga qaratilgan va, qoida tariqasida, yakuniy maqsad
mashina tarjima tizimi yaratish edi. Bu turdagi birinchi manbalar 1980 -yillarning
oxiri - 1990 -yillarning boshlarida paydo bo'lgan. So'nggi o'n yil ichida parallel
matnli korpuslar bilan bog'liq bo'lgan bir qancha loyihalar ishga tushirildi. Keling,
ulardan bir nechtasini ko’rib chiqaylik. Kanada parlamentidagi ingliz-fransuz parallel
munozaralar korpusi (Kanada-Hansards ingliz-fransuz parallel corpus). Brayton
|