Korpusning ahamiyati. Milliy korpus milliy til xazinasi demakdir. Undan lingvistlar, leksikograflar, kompyuter lingvistlari, muharrirlar, tarjimonlar, jurnalistlar, noshirlar, olimlar, o‘qituvchilar, ta’lim oluvchilar va boshqa har qanday soha mutaxassisi keng foydalanish imkoniyatiga ega bo‘ladi.
Foydalanishda deyarli kasbiy tabaqalanishga yo‘l qo‘ymaydigan til korpuslari, avvalo, tilshunoslar uchun bamisoli “vose’ maydoni” maqomida bo‘ladi. SHuningdek, tilning muayyan davridagi holati tarixchilarni ham, etnograflarni ham, adabiyotshunoslarni ham – umuman barcha gumanitar fan sohasi vakillarini birday qiziqtirish tabiiy. Ayniqsa, ona tili va chet tillarini o‘qitish va o‘rganish borasida korpuslarning ahamiyati beqiyos. Bugungi kunda dunyo miqyosida til o‘rgatish tizimi korpuslarga yo‘naltirilayotganligi ham fikrimizning dalilidir. SHuning uchun ta’lim korpuslari, sheva matnlari korpuslari, poetik matnlar korpuslari, og‘zaki, ilmiy, rasmiy matnlar korpuslari kabi qator mikrokorpuslarning tuzilayotganligi ahamiyatlidir. Masalan, rus tilining “Og‘zaki nutq korpusi” 1930-2000 yillar oralig‘ida olingan video va audio tasmalardagi matnlarda aks etgan jonli rus nutqiga asoslangan.
Dunyo til korpuslari.Dunyo miqyosida tillarning korpuslarini yaratish jadal tus olmoqda. Hatto tilshunoslikning korpus tuzishning nazariy va amaliy masalalari bilan shug‘ullanadigan “Korpus lingvisti-kasi” deb nomlangan iqtisodiy samarador yo‘nalishi shakllandi va tez sur’atlar bilan taraqqiy etmoqda.
Bugungi kunda jahon miqyosida “Britaniya Milliy korpusi” (British National corpus) keng ommalashdi va yaratilayotgan boshqa korpuslar ham unga yo‘naltirilmoqda. Ayniqsa, slavyan tillari bo‘yicha Pragadagi Karlovi universitetida yaratilgan “CHex Milliy korpusi”ning nufuzi kundan-kun oshib bormoqda.
Bunday fikrlarni yaratilayotgan “Ispan tili korpusi” (tarixiy) (100 mln so‘z, 13–20 asr matnlari asosida), “Zamonaviy dat tili korpusi” (50 mln so‘z, 1998–2002 yillar matnlari asosida), “Zamonaviy italyan tili korpusi (100 mln so‘z), “Zamonaviy xitoy tili korpusi” (720 mln so‘z, 150 mln ieroglif), “Nemis tilining Mannheym korpusi” (1610 mln so‘z) “Sloven tilining milliy korpusi (100 mln so‘z) kabilarga nisbatan ham aytish mumkin.
Rus tilining 200 mln so‘zlik matnlardan tashkil topgan ulkan milliy korpusidan tashqari xususiy ko‘rinishlardagi “Upsal korpusi”, “Tyubingen korpusi”, “Rus tilining mashina fondi”, “Rus matnlarining Xelsinki korpusi”, “XX asr oxiri rus Gazeta matnlari korpusi” (MDU), “Rus adabiy tili milliy korpusi” (SPb), “Rus tilining “Regensburg diaxronik korpusi” kabi qator korpuslar ham yaratilayotganligi uning nechog‘lik ahamiyatli ekanligini ko‘rsatadi.
MDH doirasidagi boshqa tillarning ham milliy korpuslarini yaratishga kirishilgan. “Qozoq tilining milliy korpusi”, “Tojik tilining ilk korpusi” kabilarni bunga misol qilish mumkin. Xususan, “Tojik tilining milliy korpusi (Paykarai avval zaboni tojiki) hozircha 10 mln so‘z qo‘llanishini qamrab olishi rejalashtirilgan. Tuzuvchi mutaxassislarning fikricha, mazkur korpusga, avvalo, zamonaviy tojik adiblarining asarlari, shuningdek, radio va televidenie, Gazeta va jurnallar, ilmiy-ilmiy ommabop, o‘quv adabiyotlari, rasmiy qog‘oz matnlari, bir tilli va ko‘p tilli lug‘atlar materiallari, qolaversa, taniqli mumtoz adiblar (Rudakiy, Firdavsiy, Hofiz, Hayyom, Rumiy) asarlari matnlarini ham qamrab olish rejalashtirilmoqda.