Deskriptor dillərində leksik vahidlər əvvəlcədən hər hansı tekstual əlaqələrlə bağlanmırlar. Mürəkkəb sintaktik konstruksiyalar-cümlələr və ya frazalar-sənədlərin məzmunlarının təsviri zamanı leksik vahidləri birləşdirməklə (koordinatlaşdırmaqla) qurulur. Bu dillərdə hazır cümlələr və frazalar yoxdur, odur ki, mürəkkəb anlayışların qurulmasında məhdudluqlar olmur. Faktiki olaraq çox da böyük olmayan sayda leksik vahidlərin köməyilə istənilən mənaya malik olan cümlələri formal təsvir etmək olur. Cümlənin sözləri arasında koordinasiya onun yazılışı zamanı aparıldığından, bu cür dillərə həmçinin «sonradan koordinatlaşdırılan» dillər də deyilir.
Deskriptor dili mövzu sahəsini xarakterizə edən leksik vahidləri-sözləri və sözbirləşmələrini-özündə cəmləyən lüğətdən istifadə edilməsini nəzərdə tutur. Bir çox hallarda həmin lüğətdə toplanan leksik vahidlər arasında paradiqmatik -konteksdən asılı olmayan- məntiqi əlaqələr qeyd olunur. İnformasiya axtarışında bu əlaqələrdən ən çox istifadə olunanları ekvivalentlik və tabelilik əlaqələridir.
Ekvivalentlik əlaqəsi sözün müxtəlif formalarını (hallarını) və sinonimlərini ifadə edir. Həmin söz formalarının və sinonimlərin içərisindən baxılan anlayışı daha dəqiq və tam ifadə edən bir söz və ya sözbirləşməsi seçilir və o, deskriptor (təsviredici) kimi qəbul olunur.
Tabelilik əlaqəsi baxılan sözə görə hansı sözlərin daha ümumi və ya xüsusi olmasını ifadə edir və 2 növ əlaqəni özündə birləşdirir:
-« tam-hissə »(məsələn, «kompüter»- «prosessor»),
- «soy-növ»(məsələn, « prosessor»- « Pentium-4»).
Başqa sözlə, tabelilik əlaqəsi anlayışların « Sinif-altsinif» münasibətlərini əks etdirir. İnformasiya axtarışında bu münasibətlərin nəzərə alınması mühüm əhəmiyyət kəsb edir və axtarış göstəricilərini xeyli yaxşılaşdırır.
Ekvivalentlik və tabelilik əlaqələrinin nəzərə alınması ilə leksik vahidləri (sözləri və sözbirləşmələrini) özündə cəmləşdirən lügətə deskriptorlar lüğəti deyilir [54]. Deskriptorlar lüğəti bir növ tezaurus adlanan lüğətə oxşadığından, İAS nəzəriyyəsində ona informasiya–axtarış tezaurusu və ya sadəcə olacaq tezaurus deyilir [62].
Tezaurus tematik əlamətlərə görə nizamlanmış sözlərdən və ifadələrdən ibarət olan lüğətə deyilir.Tezaurus özündə anlayışların adları lüğəti ilə təsnifat əlaqələri lüğətini birləşdirir. Beləliklə, İAS baxımından tezaurus baxılan mövzu sahəsini xarakterizə edən deskriptorları-sözləri və həmin deskriptorlarla paradiqmatik əlaqələrlə bağlı olan sözləri özündə cəmləyir. Tezaurusda hər bir deskriptor və onunla bağlı olan sözlər «deskriptor məqaləsi» adlanan vahid kimi qəbul edilir. Deskriptor məqalələrinə aid misal şəkil 9.3-də gösərilmişdir. Burada deskriptorlar tünd şriftlə yazılmışlar.
Qeyd edək ki, tezaurus bir qayda olaraq konkret problem (mövzu) sahəsi üçün yaradılır, çünki tezaurusun leksik tərkibi və leksik vahidlər arasındakı paradiqmatik əlaqələr konkret problem sahəsinə aid olur.
Sənədin və sorğunun axtarış surətlərinin tərtib edilməsi zamanı onların əsas məzmununu xarakterizə edən sözlər (və ya sözbirləşmələri) seçilir, sonra isə tezaurusdan istifadə etməklə həmin sözlər deskriptorlarla əvəz olunur. Beləliklə, deskriptor dilində təsvir edilən sənədin və sorğunun axtarış surətləri sənədin və sorğunun əsas məzmununu təyin edən deskriptorlardan ibarət olur. Bu cür deskriptor dilinə qrammatikasız dil deyilir. Qrammatikasız deskriptor dili sənədin məzmununu lazımi dəqiqliklə təsvir etməyə imkan vermədiyindən, informasiya axtarışının keyfiyyət göstəriciləri nisbətən aşağı olur.Odur ki, bir çox hallarda qrammatikalı deskriptor dilindən istifadə edilir.
Qrammatikalı deskriptor dilində sənədin və sorğunun axtarış surətinə deskriptorlarla yanaşı, qrammatik elementlər də daxil edilir. Əsasən iki cür qrammatik elementdən istifadə edilir: rol göstəricilərindən və əlaqə göstəricilərindən .
Rol göstəricisi axtarış surətində deskriptorun hansı qrammatik və ya semantik rola malik oldugunu təyin edir. Məsələn, rol göstəriciləri kimi «obyekt», «sübyekt», «vaxt», « hərəkət» (proses), «xassə», «məkan» ( yer) və s. istifadə edilə bilər.
Rol göstəricilərinin təsvirini asanlaşdırmaq üçün axtarış surətinin mövqeli yazılış formasından istifadə etmək olar . Bu halda SAS cədvəl formasında təsvir edilir. Cədvəlin sütunları rollara uyğun götürülür, məsələn,1-ci sütünda obyekt rolunda çıxış edən deskriptor, 2-ci sütunda xassə rolunda çıxış edən deskriptor, 3-cü sütunda proses rolunda çıxış edən deskriptor və s.yazılır.
Əlaqə göstəricisi SAS-i təşkil edən deskriptorlar arasında əlaqəni təyin edir, yəni baxılan deskriptorun hansı deskriptorla qarşılıqlı alaqəli olmasını göstərir. Bu halda əlaqənin tipi göstərilmir. Əlaqənin tipini baxılan deskriptorun rolu ilə təyin etmək olar. Bu halda qrammatik konstruksiya kimi rol və əlaqə göstəriciləri birlikdə tətbiq edilir. İndeksləşdirmə prosesinin mürəkkəbləşməsinə baxmayaraq bu cür qrammatik konstruksiya sənədlərin məzmununu daha dəqiq təsvir etməyə və axtarışın intellektual səviyyəsini artırmağa imkan verir.
Qeyd edək ki, qrammatikasız deskriptor dilindən istifadə edildikdə axtarış dəqiqliyinin aşağı olması nəticəvi informasiyanın izafiliyinə səbəb olur. Bu halda izafi informasiyadan faydalı informasiyanın seçilməsinə müəyyən vaxt və əmək sərf olunur. Lakin bu əlavə sərflər qrammatikalı deskriptor dilindən istifadə edildikdə indesləşdirmənin mürəkkəbləşməsi ilə bağlı əlavə əmək və vaxt itgisi ilə müqayisədə çox olmur. Odur ki, informasiya-axtarış sistemlərinin əksəriyyətində qrammatikasız deskriptor dilindən istifadə olunur.
Dostları ilə paylaş: |