Korpusning tuzilishi va tarkibi Mavjud milliy korpuslarni kuzatish asosida korpusning tuzilishi va tarkibini o‘rganar ekanmiz, korpus interfeysi, qidiruv tizimi va matnlar bazasi uning eng asosiy tarkibiy qismi, degan xulosaga kelamiz. Rus tili milliy korpusi (Natsionalniy korpus russkogo yazыka (NKRYa)) joylashgan www.ruscorpora.ru saytining birinchi sahifasida korpus va uning tuzuvchilari haqida asosiy ma’lumot, o‘ng tomondagi menyuda istalgan sahifaga o‘tish imkoniyati mavjud. Bu korpus menyusi to‘rt qismdan iborat. Bosh sahifa, saytning qidiruv resursi, matn haqida unga biriktirilgan qo‘shimcha ma’lumot ilovasi, korpus birliklariga izoh yozish prinsiplari, oxirgi blok korpus tuzuvchilari jamoasi, foydalanilgan dastur, matnlarning mualliflik huquqi haqida to‘liq ma’lumotlar bazasidan iborat.
Albatta, korpusning tuzilishi va tarkibi tilning xususiyatlari, ijtimoiy talab va boshqa jihatlarga ko‘ra turlicha bo‘lishi mumkin. Korpuslar uchun yagona va o‘zgarmas andoza belgilanmaydi. Masalan, tuzilajak o‘zbek tili korpuslari jamiyatimiz talablaridan kelib chiqqan holda o‘ziga xos bo‘lishi mumkin. Korpusdagi milliy so‘zi nafaqat tilning, balki korpus tuzilishi va tarkibining ham o‘ziga xosligini anglatadi.
Korpusning ijtimoiy ahamiyati Korpus katta hajmli lug‘atlarni tuzish uchun manba vazifasini o‘taydi. Vaqt o‘tishi bilan korpus turli lingvistik yo‘nalishlar uchun ahamiyatli bo‘lishi bilan kuchli informatsion resursga aylandi. Korpus asosida kompyuter yordamida lug‘atlar avvalgiga nisbatan tezlik bilan tuziladi va qayta ishlanadi. Shu yo‘l bilan ish boshlanishidan tugash jarayonigacha (nashrgacha) tilni aks ettirib turadi, lug‘at maqolasi “eskirish”ga ulgurmaydi. Tilning zamonaviy holatini aks ettiruvchi korpus turli davrlarda yashab ijod etgan ijodkorlarning mualliflik korpuslari uchun asos bo‘lib xizmat qiladi.
Korpusning so‘zshunoslik sohasidagi ahamiyati shundaki, so‘zning qo‘llanish davri va chastotasini aniqlashda hech qanday vosita korpusga tenglasha olmaydi. Korpus lingvistikasining keyingi taraqqiyot bosqichida statistik tadqiq metodi kompyuter tarjimasi, nutqni sintezlash va tanish, aniqlash, orfografik tekshiruv kabi lingvistik amallarni bajarishda qo‘l kela boshladi. Rus va Yevropa tilshunosligida til bo‘yicha qilinadigan barcha tadqiqotlarning korpusga asoslanishi odatiy holga aylangan va hatto ba’zi tadqiqotlarda majburiy ham sanaladi. Yaqin orada til o‘rganayotgan o‘quvchi yoki uning biror jihatini tadqiq etayotgan kishining bugungi kunda lug‘atga bo‘lgan ehtiyoji korpusga ko‘chishi shubhasiz.
Gap qurilishini o‘rganishdagi ahamiyati tilning jonli qurilishini, so‘zlarning o‘zaro birikish imkoniyatini tahlil qila olishida ko‘rinadi. An’anaviy tilshunoslikdagi misolni olishda badiiy asar tiliga tayanish tajribasidan ko‘ra korpusga tayanish misolning bugungi kun uchun ham ishonarliligini ta’minlaydi.
Korpus tarjima dasturlarini yaratishda katta ahamiyatga ega.
Uslubiyatni o‘rganishda matnning uslubiy o‘ziga xosligini tahlil etishda ham korpusga tayanish mumkin. Bu amaliyotni bajarishda matnlarning statistik holati tahlilini (matndagi jumlaning uzunligi, bir so‘zning boshqa so‘z bilan birikish holatining doimiy yoki noodatiyligi) aniqlashtiradi. Bunday usulda korpus yordamida yozma nutq bilan birga og‘zaki nutqni ham o‘rganish mumkin bo‘ladi. Masalan, rasmiy ish qog‘ozlarida hujjat matnida shartnoma bo‘yicha talablar shakli ma’qulmi yoki shartnoma talablari konstruksiyasi to‘g‘rimi? Korpusga bu tarzda berilgan savolga javob sifatida sanoqli daqiqalarda qaysi shakl ko‘proq qo‘llanishini aniqlab beradi. Shunday qidiruv natijasida rus tili milliy korpusida shartnoma bo‘yicha talablar konstruksiyasi 40 marta, shartnoma talablari shakli 3 marta qo‘llanganligi to‘g‘risida statistik ma’lumot beradi. Bu konstruksiyaning qo‘llanishi, albatta, rus tiliga xos, ehtimol, u o‘zbek tilida boshqacha natija bersa kerak. Korpusimiz bo‘lmaganligi tufayli bu savolga aniq javob bera olmaymiz.
Korpus juda muhim bo‘lgan va faol qo‘llanadigan soha – lingvodidaktika, u ona tili va xorijiy tilni o‘rganishda birdek ahamiyatli. Tilni o‘rgatishda lug‘at boyligining kattaligini ko‘rsata olish, so‘zning qo‘llanish imkoniyatini u yoki bu grammatik qurilish orqali tushuntirish uchun misollar massivini ko‘rsatishda korpus juda qo‘l keladi. Til ta’limi uchun muhim bo‘lgan misolning doimiy yangilanib borishi, buni aks ettirib turish xususiyati hamda imkoniyati faqat korpusga xos. O‘qituvchi yangi, ishonarli, cheksiz hamda xilma-xil misollarni shu yerdan topa oladi, topshiriq va mashqlarni belgilashda qiynalmaydi, bir necha daqiqada mavzu bo‘yicha yangi misollardan iborat mashq tayyorlay oladi. Korpusda mavjud matnlarni saralash imkoni mavjud, misolni barcha matnlardan emas, balki izlanuvchi uchun qiziqarli va kerakli bo‘lganidan ajratish mumkin. Hatto korpus matnlarini belgilangan davr (hatto aniq yiligacha), matnning aniq bir turi (masalan, reklama matni, ish hujjati yoki shunchaki bir necha muallif asarlari)ni tanlab olish imkoniyati mavjud. Turli mavzu va janrdagi matnlar bilan doimiy boyitilishi korpusning asosiy xususiyatidan biri, u ta’limda yo‘naltirib o‘qitish imkoniyatini ochadi. Akademik litsey va kollejda ona tili barcha yo‘nalish va mutaxassisliklarda o‘qitiladi. Yo‘nalishlarning mavzusi bir xil bo‘lishi mumkin, lekin har bir mutaxassislikda mavzuni tushuntirish uchun mos matnni tanlashda korpusdagi imkoniyat birorta manbada yo‘q. Aslida akademik litsey va kasb-hunar kollejlari DTSida maqsad ham egallayotgan mutaxassisligi bo‘yicha yozma va og‘zaki nutqini rivojlantirish deb belgilangan. Ayni bir mavzu (masalan, so‘zning shakl va ma’no munosabatiga ko‘ra turi, atamashunoslik, toponim, qo‘llanish doirasi chegaralangan leksika va h.) turli yo‘nalishda alohida, ixtisoslashtirilgan matnlar asosida o‘rganilishi lozim. Shundagina til ta’limi o‘z maqsadiga erishgan bo‘ladi. Til ta’limiga bag‘ishlangan darslik va qo‘llanmalarda iqtisod, moliya, siyosat, huquqshunoslik kabi mavzudagi matnlarga duch kelmaymiz, misolni badiiy asardan olishga odatlanib qolganmiz. Vaholanki, adabiy til badiiy asar tili degani emas. Til ta’limi hayotdan uzilib qolgan: kundalik turmushda o‘quvchi tuzadigan, ishlatadigan yoki tahlil etadigan matnlardan uzilib, mashq va topshiriqni jonli tildan olmaslikka ko‘nikib qolganmiz. N.R.Dobrushina rus tili bo‘yicha darslik va qo‘llanmalarni tahlil qilarkan, shunday yozadi: “Tipik rus tili darsligida mashqdagi misollarning 60 foizi XIX asr, 20 foizi XX asr badiiy adabiyotiga oid; 10 foizi muallif tomonidan tuzilgan; zamonaviy OAV materialidan esa bitta ham misol yo‘q. Albatta, darslikda mumtoz nasr namunasi berilishi tabiiy, ijobiy holat. Bugungi kun o‘quvchisi o‘zi uchun ancha notanish bo‘lgan bu matnni o‘qishni unutmasligi uchun ham kerak. Agar ta’limning biz o‘qitayotgan shaxsga aniq qaratilishi va ta’lim maqsadiga erishishini, ta’lim va hayot o‘rtasida favqulodda katta tafovut bo‘lmasligini istasak, zamonaviy til (hozirgi adabiy til)ga murojaat etishimiz, darslikka faqat badiiy adabiyot namunasi emas, balki kundalik turmush tarzi va hayot bilan bog‘liq matn namunalarini ham kiritishimiz kerak”.
O‘qituvchi uchun korpus tengsiz xazina, undan har bir o‘quv mashg‘uloti uchun serqirra va mazmunli o‘quv materiali tayyorlash mumkin bo‘ladi. Yuqorida aytib o‘tganimizdek, korpusda xilma-xil matnlar jamlanib, undan o‘qituvchi istalgan shaklda foydalana oladi. Masalan, o‘qituvchi topshiriqni tayyorlash uchun faqat badiiy adabiyot parchasidan (yoki nobadiiy matndan: sport, avtobiografiya yoki shunchaki ma’lum ijodkor ijodi bilan chegaralanmoqchi) foydalanmoqchi. Unda “Mening korpusim” ilovasi orqali o‘ziga kerakli matnni ajratib olish imkoni mavjud, ya’ni misollar sirasini chegaralaydi. Korpus turli janr va uslubdagi matnlarni qamrab olganligi sababli har qanday talabni qondirish imkoniga ega. Misol uchun, jurnalistika fakulteti talabalari uchun yozilgan darslikda publitsistik matnlar ancha eskirgan. Har kuni boyitilib boradigan korpusdan yangi misollarni olish, uni talabaga taqdim etish yoki talabaga ham shunday topshiriq berish, albatta, ta’limni bugungi hayotga yaqinlashtiradi. Ko‘pincha qayta-qayta nashr etilgan darslikda misollar eskiligicha qolib ketadi va axborot bilan shiddatli yangilanib borayotgan bugungi kun uchun mavzu eskiradi, talaba bilimni davr bilan hamohang o‘zlashtirmaydi. Ular ta’lim jarayonida so‘zning nozik qirrasini o‘rganish, uni nutqida qo‘llash ko‘nikmasini shakllantirishda nimaga tayanadi? XX asr boshi yoki o‘rtasida yozilgan asar bilan ishlash jarayoni unga hozirgi adabiy til uslubini shakllantirish uchun yetarli emas. Bugun filolog yoki jurnalist bo‘lib yetishayotgan mutaxassis tilimizning barcha nozik qirralarini his etishi uchun faqat eski − 20-30 yil oldingi matn namunasi yetarli emas, bugun yozilgan barcha soha, uslub va janrdagi asarlar bilan ishlashi lozim, shundagina ta’lim ijtimoiy buyurtmani bajargan hisoblanadi. Qaysi fanlar, uning aynan qaysi bo‘limida korpusdan qanday foydalanish mumkinligini aniq misollarda ko‘rib o‘tamiz.
Til korpusidan o‘qituvchi, talaba va maktab o‘quvchisi ham ancha unumli foydalanishi mumkin. Chunki faqat korpus orqali juda osonlik bilan kam ishlatiladigan so‘z, ibora va birikmani topish, qo‘llanishi va yozilishi (orfografiyasi)ni o‘rganish mumkin. Ta’kidlash joizki, til korpusida til grammatika va darslik muallifi tavsiflanganidek emas, balki jamiyatda qanday yashasa va ishlasa, shunday aks etadi. Bu esa o‘quvchini o‘zini o‘rab turgan muhit − umumxalq tili va adabiy tilni o‘rganishda eng sermahsul vosita bo‘lib xizmat qiladi.
Ingliz, nemis, fransuz, rus tillarini xorijiy til sifatida o‘qitish masalasi metodikada alohida tadqiq etilmoqda. Aynan til o‘rgatishni maqsad qiluvchi korpuslar ham mavjud bo‘lib, “Uchebnыy korpus russkogo yazыka”, “Leaner corpus of english” shular jumlasidan. Xorijiy til vakillari auditoriyasi bilan ishlash jarayonida til korpusining ahamiyati bir necha martaga ortadi. Tadqiq predmeti ona tili bo‘lmagan (ikkinchi yoki xorijiy til hisoblangan) o‘qituvchi va o‘quvchi uchun ham korpus juda muhim va qulay vosita. Til egasi uchun tildagi turli qo‘llanishlar uni kundalik hayotda qamrab tursa, xorijiy til egasi uchun bu holat noodatiy, u o‘rganayotgan har bir til hodisasi bilan bevosita mufassal, turli misollar bilan keng tanishishi lozim. Ta’kidlash joizki, ilk rus tili korpuslari Rossiyada emas, Yevropada rus tili tadqiqotchilari tomonidan yaratilgan.
Til korpusiga eng ko‘p ehtiyoj sezuvchi mutaxassis bu matnni avtomatik qayta ishlash (masalan, tarjima dasturi) va turli qidiruv tizimlari bilan ishlaydigan dasturchi. Chunki u tabiiy til bilan ish ko‘radi hamda ushbu tilda yozilgan barcha matnlar strukturasini (tabiiy va jonli tilda, ilmiy grammatika va darsliklardagi misollarga tayanib emas) mukammalroq “tushunishi”, his etishi lozim.
Til korpusiga ehtiyoj sezadigan mutaxassislardan yana biri – kundalik ish jarayonida yozma va og‘zaki nutq jozibasiga tez-tez murojaat etuvchilar: gazeta va jurnal muharriri, jurnalist, radio va televideniya xodimlari. Chunki bu mutaxassislar ma’lum bir so‘z, ibora yoki gapning qo‘llanish holati, darajasi, kim, qachon ilk marta bu gapni qo‘llaganligi, qanday uslub uchun xoslanishini bilishga grammatika bilan shug‘ullanuvchi olimdan ko‘ra ko‘proq ehtiyoj sezadi. Korpusdan tashqari hech qanday axborot banki bu kabi savollarga zudlik bilan javob berishi mumkin emas. Shuning uchun korpus lingvistikasi tadqiqotchilari korpuslar jurnalist, muxbir, muharrir, o‘qituvchi hamda dasturchi uchun maxsus yaratila boshlangan, degan xulosaga ham kelishadi. Biz bugungacha darslik, ilmiy grammatika va lug‘atga qanday tayangan bo‘lsak, zamonaviy soha vakillari korpusga shu qadar ehtiyoj sezishadi, undan foydalanishadi.