Matnlar korpusi («corpus» - lotincha «tana» degan ma’noni anglatadi) - elektron holda saqlanadigan ma’lum til birliklari bo‘lib, ular tilshunoslar uchun turli xil muammolarni hal etish uchun tatbiq etishda va turli yo‘nalishdagi tadqiqotlar uchun zaruriyatga qarab turli shakllarda tuziladi. Til birliklarining qay tarzda saqlanishiga qarab maxsus dasturlar yordamida har bir kerakli so‘z yoki so‘z birikma^i uchun darhol uning qo‘llanishi bo‘yicha misollar topilishi, imlo bo‘yicha variantlari, sinonimik qatorlari topilishi mumkin. Matnlar korpusiga oid ilmiy tadqiqotlar salmog‘ining ko‘payishi natijasida tilshunoslikda korpus lingvistikasi yo‘nalishi shakllandi.
Kompyuterda yaratilgan birinchi matnlar korpusi Braun korpusi (БК, ing- lizcha Brown Corpus, BC) hisoblanadi, u 1961-yilda Braun universitetida yaratilgan, har biri 2000 so‘zli 500 ta matn fragmentini o‘z ichiga oladi. 1970-yillarda 1 mln so‘zni o‘z ichiga olgan matnlar korpusi asosida rus tilining chastotali lug‘ati yaratildi. 1980-yillarda Shvetsiyaning Upsala universitetida ham rus tilida matnlar korpusi yaratildi. Buyuk Britaniyada Ingliz tili Banki (Bank of English) hamda Britaniya Milliy Korpusi (British National Corpus, BNC), Rossiyada Rus tilining mashina fondi (Машинный фонд русского языка) hamda Rus tilining Milliy korpusi (Национальный корпус русского языка) loyihalari ishlab chiqildi. Masalan, Rus tilining Milliy korpusi hajmi hozirgi kunda 149 mln so‘zdan iborat. Keyingi yillarda Internet tizimining rivojlanishi virtual matnlar korpusining yuzaga kelishiga olib keldi. Ya’ni lnternetdagi qidiriv saytlari, elektron kutubxonalar, virtual ensiklopediyalar korpus vazifasini bajarmoqda. Korpusning janri va tematik rang- barangligi Internetdan foydalanuvchining qiziqishlariga bog‘liq. Masalan, ilm- fan doirasida Wikipediakatta hajmdagi matnlar korpusi sifatida ishlatilmoqda.
Keyslar
Keys 1. O‘zbek tilining kompyuter uslubi yaratish uchun asosiy mezonlari sifatida qo‘yidagilarni ajratib ko‘rsatish mumkin:
a) aniqlik, qisqalik, lo‘ndalik; bir qiymatlilik;
b) jahon andozalari talablariga moslik;
v) barcha uchun birdek tushunarlilik (muayyan bir fikrning umum tomonidan adektiv qabul qilinishi);
g) turli badiiy tasvir vositalaridan xolilik (shu jumladan, sinonimlar turli variantlari ham kompyuter uslubiga kiritilmaydi, sinonimlik qatorlarning dominantasi tanlab olinadi;
d) so‘zlar asosan bir ma’nolilik kasb etadi (ya’ni uslubga so‘zlarning faqat denonativ semalari qamrab olinadi, konnotativ semalarga e’tibor qilinmaydi).
e) kompyuter talablari qat’iy hisobga olinadi.
O‘zbek tilshunosligi oldida qilinishi kerak bo‘lgan ishlay talaygina.