Tahlil va natijalar. L.I.
Kolodnyajnaya
leksikografiyani an’anaviy hamda raqamli kabi ikkiga ajratadi.
Tarjima jarayonida ham ikki yondashuv borligi ko‘rsatib
o‘tiladi: 1) leksikosentrik (konteksdan kelib chiqib tarjima
qilish); 2) slovarsentrik (mashina yordamida analiz qilish).
Raqamli (elektron) leksikografiya 60-yillarda shakllangan
bo‘lib, uning ilk ibtidosi sifatida Brown korpusi, 1978-yilda
avtomatiklashtiruvchi tizim va tilni qayta ishlash uchun
maxsus kodlangan zamonaviy ingliz tili Longman lug‘ati
(Longman
Dictionary
of
Contemporary
English)kabi
lug‘atlarni keltirishimiz mumkin.
Professor N. Abdurahmonova zamonaviy lug‘atlarni
yaratish masalalari bo‘yicha quyidagi fikrlarni bildiradi:
“Lug‘atlarning yaratilishida uch narsa hisobga olinishi kerak:
-lug‘atlarning yaratilishiga ko‘ra maqsad va vazifalari;
-lug‘atda tavsiflangan matnlar;
-foydalanuvchilarning kategoriyasi” [1].
Bugungi kunda internet tarmoqlarining yanada
taraqqiy etishi hamda uning tilga ta’siri natijasida korpus
leksikografiyasi yoki kiberleksikografiya singari zamonaviy
yo‘nalishlar yuzaga kelmoqda.
“Korpus
leksikografiyasi – ma’lumotlarni saqlash, uzatish va analiz
qilish kabi vazifa bajarishga yo‘naltirilgan kompyuterning
muayyan fazasida ko‘p qo‘llaniladigan matn yoki akustik
korpusi asosida tilni o‘rganish sohasi hisoblanadi” [2]. Til
korpusi bevosita kompyuter lingvistikasi bilan aloqador bo‘lib,
unga bo‘lgan talab kundan kunga oshib bormoqda. Til
umumlashmasidan iborat korpus ikki bo‘limdan tashkil topadi,
ya’ni:
Koprusning tuzilishi(3-chizma): Kompyuter texnologiyalari bilan uzviy bog‘liq bo‘lgan
korpus
leksikografiyasi
tilni
analiz
qilish
bilan
cheklanmasdan, kompyuter vositasida matnni tahlil qilishning
metod
hamda
texnologiyalarini
o‘rganadi.
Kiberleksikografiyada matn bilan ishlashda yoki lug‘at
yartishda internetdan to‘liq foydlaniladi.
Yirik
hajmdagi
tilshunoslik
resurslari
internet
foydalanuvchilari, soha mutaxassislari tomonidan to‘ldirib
borilmoqda. Bu xususda manbalarda quyidagi ma’lumotlar
uchraydi: “Soha mutaxassislari tomonidan “ko‘ngillilar
leksikografiyasi” (“волонтёрской лексикографии” – user –
generated lexicography) deb nomlanadi. Ko‘plab nashriyotlar
internet
orqali
ma’lumotlarini
shu
usulda
boyitib
borishmoqda: Wikipedia, Urban Dictionary, Wordnik,
MacMillan Open Dictionary kabilar [3].
Internet lug‘atlari (on-line lug‘atlar) aksariyat hollarda
lug‘at foydalanuvchilariga elektron lug‘atlarni boyitish
imkonini yaratadi. Shu bilan birga, hajman ixchamligi,
multimedia tasvirlari bilan boyitilganligi, kompaktligi, boshqa
manbalarga ulanish imkoniyati, matn korpuslari vositasida
illyustrativ misollar tuza olish imkoniyati, so‘zlarning
sinonimik variantalri, omonimlik shakllari, Grammatik
ma’lumotlar joylanganligi va ularning tez fursatda
foydalanuvchiga namoyon bo‘lishi kabi tomonlari elektron
lug‘atlarning optimalligini yuzaga keltiradi. Internet
sahifalarida bu haqida quyidagi ma’lumot uchraydi:
“Zamonaviy lug‘atshunoslikda semantik tarmoq semantik
maydon, semantik to‘r va freym semantikasining tez
suratlarda kirib kelishi natijasida elektron leksikografiya
resurslari yaratildi. FRAMENET shu kabi yirik leksikografik
resurslardan biri bo‘lib, bu resurs internet tizimida on-line
rejimda ishlaydi” [4].
Ushbu tizim Ch. Filmorning “Tools for Lexicon
Building” loyihasi asosida Kaliforniya shtati, Berkli
shahridagi
xalqaro
informatika
institutida
yaratilgan.
Tilshunos Z. Xolmanova framenet resursining ma’lumotlar
bazasida 10000ta leksik birlik mavjudligi, shundan 6000dan
ortig‘i to‘liq annotatsiyaga egaligi, shuningdek ma’lumotlar
bazasida 800ta semantik freym hamda 135000 annotatsiyali
gaplar joylanganligini keltirib o‘tadi[5].
Kitobiy (an’anaviy) va elektron leksikografiyaning
asosiy vazifasi lug‘atdagi maqolalarning joylashish o‘rni va
holatini shakllantirish hamda lug‘at tuzilishini aniqlashdir.
So‘zlarning shakl kompozitsiyasi ko‘rsatilgan izohlar
qanday holatda keltirilishi inobatga olinsa, kompyuter
(elektron, avtomatik) lug‘atni yaratish qoidalariga ko‘ra
foydalanuvchilarga mo‘ljallangan kompyuter formatida yoki
ma’lum bir tarkibiy qism dasturi sirasiga kiritilgan dasturdan
foydalaniladi. Shuningdek, foydalanuvchining lug‘atdan qay
holatda foydalanishiga ko‘ra electron lug‘at hamda matnni
tahrirlovchi dastur uchun avtomatik lug‘atlar o‘zaro
farqlanadi. Avtomatik lug‘atlarni erkin tarzda ishlatish
mumkin. Mutaxassis N.Abdurahmonova bu kabi lug‘atlar
sirasiga quyidagi lug‘atlarni keltirib o‘tadi:
- Ingliz tilining Oksford lug‘ati (
WWW.oed.com
)
-Ingliz tilining avtomatik izohli lug‘ati Collins
(WWWmycobuild.com)
-Y.D. Apresyan va E.M. Mednikovaning “Yangi katta
hajmli inglizcha –ruscha” lug‘atining avtomatik variant
(
http://eng-rus.slovaronline.com
)
-Ojegova onlayn lug‘ati (http://slovarozhegova.ru) [6].
Matnlarni avtomatik referatlash ma’lumotlarni izlash
hamda mashina tarjimasi uchun mo‘ljallangan avtomatik
lug‘atlar bevosita insonlar uchun yaratilgan avtomatik
lug‘atlardan maqolalarning interfeysi va strukturasi jihatidan
katta farq qiladi. Strukturalarning farqli tomoni shundaki,
dastur bilan aloqador mavzularning lug‘atga doir materiallari
bilan bevosita unga yaqin bo‘lgan boshqa sohalarni-da o‘z
ichiga olgan. Bu kabi lug‘atlarning tarkibiy qismida ma’lum
bir maqolaga ilova shaklida bo‘lgan bir necha yuzlab ilovalar
mavjud bo‘ladi.
Ma’lumki, an’anaviy (kitobiy) lug‘atlar mavzusiga
ko‘ra ensiklopedik va lingvistik kabi turlarga ajratiladi. Ular
quyidagi tuzilishdan iborat:
-Kirish qismi, lug‘atda berilgan maqolalar strukturasi
bo‘yicha ma’lumot, foydalanish bo‘yicha yo‘riqnoma;
-Berilgan birliklardan jamlangan so‘zlik: morfema,
leksema, so‘zshakllar yoki so‘z birikmasi;
-Lug‘at maqolalarida o‘z izohiga ega bo‘lgan birlik;
-Indekslar;
-Adabiyotlar ro‘yxati;
-Shartli belgilar hamda alifbo.