9-mavzu Tarjima amaliy lingvistikaning tarmog\'i sifatida
4. Mashina tarjimasi va avtomatik tarjima Mashina tarjimasi yoki avtomatik tarjima - muayyan so‘z yoki matnlarning kompyuter yordamida bir tildan boshqa tilga qilingan tarjimasi. Avtomatik tarjima (mashina tarjimasi) kompyuter lingvistikasining asosiy yo‘nalishlaridan bo‘lib, avtomatik tarjima tizimi prinsip va metodlari haqidagi bilimlarni hosil qilish, lingvistik ta’minot yaratish, mavjud tizimlar va lug‘at yaratish tarixi, til haqidagi bilimlar, ko‘nikmalarni shakllantirish, mashina tarjimasi tizimining lingvistik protsessorini shakllantirishda lingvistik tahlilni algoritmlash tizimini amalga oshiradi. Avtomatik tarjima oldiga quyidagi vazifalar qo’yiladi:
- avtomatik tarjima tizimini yaratish va undan foydalanishning asosiy prinsiplarini o‘rgatish;
- tilning nazariy asoslari (formalizatsiya) metodlari va vositalari bilan tanishtirish;
- avtomatik tarjima tizimi lingvistik protsessorni yaratishda so’z va uning ma’nosi, gap strukturasi, semantikasi va matn tahlilida lingvistik algoritm bosqichlarini o‘rgatish.
Avtomatik tarjima quyidagi masalalarni qamrab oladi:
l. Avtomatik tarjima-sun’iy intellekt yo‘nalishi.
2. Avtomatik tarjima turlari qo’l tarjimasi, avtomatik tarjima. Qo‘l tarjimasining turlari, shakllari, tiplari. Avtomatik tarjima strategiyasi: so‘zma-so‘z tarjima, transfer yordamidagi tarjima, interlingvo yordamidagi, lingvistik tahlilga asoslangan batafsil tarjima, tarjima xotirasi.
3. Lingvistik tahlilga asoslangan mashina tarjimasi algoritmi. Matnning morfologik, sintaktik, semantik tahlili. Tarjima qilinayotgan tilda matn sintezi: matning semantik ko‘rinishi, sintaktik strukturalar qurilmasi, morfologik sintez.
4. Avtomatik tarjimaning struktural tizimi. Mashina tarjimasining lingvistik bilimlar bazasi strukturasi: lingvistik ma’lumotlar bazasi va lingvistik protsessor. Lingvistik ma’lumotlar bazasi komponentlari. Lingvistik protsessor strukturasi (tuzilishi).
5.Tarjima xotirasi. Misollarga asoslangan mashina tarjimasi tizimlari. Tarjima xotirasi tizimi uchun matnlar korpusi (to‘plami) qurilmasini shakllantirish prinsiplari. Tizim strukturasi (tuzilishi) va ishlash algoritmi. Tarjima xotirasining qo’llanish sohalari. Mashina tarjimasi tizimlarida tarjima xotirasining qo‘llanish sohalari.
6. Avtomatik tarjimaning boshqa bilim sohalari bilan bog’liqligi. Sun’iy intellekt tadqiqida mashina tarjimasi va kompyuter lingvistikasi. Mashina tarjimasining matematik lingvistika va psixolingvistika bilan bog‘liqligi.
7. Avtomatik tarjimaning lingvistik muammolari. Morfologik va semantik doiradagi muammolar. O‘zakdosh va o‘zakdosh bo‘lmagan tillarning formal va mazmuniy nomutanosibligi. Muammolar yechimi yo‘llari. Mashina tarjimasining semantik va pragmatik muammolari. Polisemiya masalasini hal qilishda kontekst va ekstralingvistik faktlarni hisobga olish. Avtomatik tarjima sifatini oshirishda va semantik tahlil borasida qiyinchiliklarni hal etish yo‘llari.
Avtomatik tarjima “Kompyuter lingvistikasi”, “Kvantitativ lingvistika”, “Bilim injeneriyasi”, tabiiy tilning avtomatik ishlab chiqilishi, sun’iy intellekt muammolari bilan bog’liq. Bu sohalarning kompleks rivoji sun’iy intellekt taraqqiyoti haqida to’liq tasavvur hosil qilishga yordam beradi. Avtomatik tarjima til o‘rgatishning zamonaviy yo’nalishlari va lingvistik tahlilni informatsion texnologiyalar yordamida algoritmlash, bilimlarni tatbiq qilish, bilimlar bazasi, lingvistik bilimlarni yaratish prinsiplari bilan chuqurroq tanishishga imkon yaratadi.
Avtomatik tarjima Yevropada alohida fan sifatida o‘qitiladi. Avtomatik tarjima bo‘yicha dastlabki g‘oyalar ingliz olimi Charlz Bebbidj tomonidan 1836-1848 yillarda ilgari surilgan. Uning fikricha, mexanik-elektron mashinalar kodlashtirilgan avtomatik tarjimani amalga oshirishi mumkin bo’ladi. Uning loyihasi bo‘yicha 50 mingta so‘z xotira kuchiga ega bo’lgan elektron mashinalar 100000 ta so’zni avtomatik ravishda tarjima qilishi zarur bo’ladi.
Hozirgi kunda dunyoda keng tarqalgan jahon tillari uchun avtomatik tarjima dasturlari ishlab chiqilgan. Jumladan, ruschadan inglizchaga, inglizchadan ruschaga, ruschadan fransuzchaga yoki aksincha tarzdagi dasturlar yaratilgan.
Bugungi kunda avtomatik tarjimaning quyidagi sistemalari mavjud:
SYSTRAN avtomatik tarjima sistemasi- AQSH harbiy havo kuchlari buyurtmasi bo’yicha D. Tom rahbarligida ishlab chiqilgan. 1974—1975 yillarda bu tizimdan NASA aerokosmik assotsiatsiyasi tomonidan Apollo - Soyuz loyihasi hujjatlarini tarjima qilishda foydalanildi. Mazkur tizim yordamida bir yilda 2,5 mln sahifa matn ingliz tilidan nemis, fransuz, ispan, yunon, italyan tillariga hamda fransuz tilidan ingliz, ispan, italyan tillariga tarjima qilinadi.
YEUROTRA sistemasi - Yevropa olimlari tomonidan ishlab chiqilgan. 1982-yilda “Yevropa iqtisodiy hamkorligi” (Европейское экономическое сообщество) barcha Yevropa tillari uchun mo‘ljallangan EUROTRA avtomatik tarjima dasturi yaratilganligini ma’lum qildi. Dastavval, loyiha 12 mln dollarga baholandi, 1987 - yilda mutaxassislar bu loyihaga 160 mln dollardan ko‘p mablag’ sarflash kerakligini aniqladilar. Sistema 40 mln ta so‘zdan iborat xotira kuchiga ega. Bu sistema barcha Yevropa tillari bo’yicha avtomatik tarjimani amalga oshira oladi.
SOKRAT sistemasi - 40 mln ta so‘zdan iborat xotira kuchiga ega. Dunyodagi 40 ta tilda avtomatik tarjimani amalga oshiradi. Windows operatsion tizimi versiyasi mavjud bo’lgan tillarda shu tizim asosida avtomatik tarjimani amalga oshirish mumkin bo‘ladi.
LINGVO sistemasi (lingvo kompyuter lug‘ati) - bu lug’atga ham dunyoning 40 ta tilidagi ma’lumotlar jamlangan.
DIANA - avtomatik tarjima bo’yicha dunyodagi eng yirik loyiha. 1991-yilda AQSh da NASA mutaxassislari tomonidan yaratilgan. Uning hajmi 10 mln ta so‘zni tashkil etadi. U dunyoning 6 ta yirik tiliga - ingliz, rus, fransuz, nemis, arab, ispan tillariga asoslanadi: 1990-yillarda Amerikada Global Link, Rossiyada PROMT avtomatik tarjima tizimlari yaratildi).
Internet tizimining rivojlanishi natijasida avtomatik tarjima global tarmoqda ham tashkil etildi, ya’ni hozirgi kunda online-tarjima tizimi ham faol yo‘lga qo‘yilgan.
Tarjimon dasturlar ikki xil ta’minotga asoslanib ishlaydi: 1) lingvistik ta’minot - bunda mavjud tillarning umumiy leksikoni kiritiladi, uning grammatikasi joylashtiriladi, bir so‘z bilan aytganda, ma’lumotlar bazasi yaratiladi; 2) dasturiy ta’minot - bunda bir tildan ikkinchi tilga tarjima qilish algoritmi va kompyuter analizi ishlab chiqiladi (maxsus programmalashtirilgan tillar yordamida).
Avtomatik tarjimaning ishlash algoritmi quyidagicha bo‘ladi:
1. Boshlanish - dasturlar paneli va menyu satri ko‘rinadi.
2. Ishlash rejimi tanlanadi (tarjimaning yo‘nalishi - inglizchadan ruschaga yoki ruschadan inglizchaga). Jumla kiritiladi va xotiradagi kodi qidirib topiladi.
3. Topilgan kod maxsus dasturlar yordamida qayta ishlanadi va tarjima oynada paydo bo‘ladi.
4. Joriy rejimda ishlashni davom ettirish haqida so‘raladi.
5. Dasturni yopish haqida savol so‘raladi.
6. Dastur yopiladi.
Avtomatik tarjimada samaradorlikning yuqori bo‘lishiga tabiiy tillarning ayrim jihatlari - polisemiya (ko‘p ma’nolilik), omonimlik, frazeologizmlar, idiomalar, paremalar, troplar to‘sqinlik qiladi. Shularni istisno qilganda, hozirda avtomatik tarjima yo‘nalishida yuqori samaradorlikka erishilgan. Hatto hozirda faqat avtomatik tarjima yo‘nalishiga bag‘ishlangan saytlar ham yaratilgan. Bu avtomatik tarjimaning keng qamrovda taraqqiy etayotgan yo‘nalishlardan ekanligini ko‘rsatib turibdi.
Hozirgi kunda inglizcha-o‘zbekcha va o‘zbekcha-inglizcha kompyuter tarjimasi dasturlari juda katta ahamiyatga ega. Ma’lumki, ingliz va o‘zbek tillari leksikgrammatik xususiyatlariga ko‘ra bir-biridan tubdan farq qiladi. O‘zbek tilida gap qurilishi SOV (ega+to‘ld+kes) qolipida bo‘lsa, ingliz tilida SVO (ega+kes+to‘ld) qolipidadir; o ‘zbek tili agglutinativ tillar sirasiga kiradi, ingliz tili esa flektiv til hisoblanadi. Shuning uchun ingliz tilidan o‘zbekchaga va o‘zbekchadan inglizchaga kompyuter tarjimasini yaratish o‘ziga xos qiyinchliklarni keltirib chiqaradi. Bugungi kunda rus tili vositasida ingliz tilidan o‘zbek tiliga avtomatik tarjima qiluvchi dasturlarning versiyalari e’lon qilingan.