152
- sinonimlər və tezaurus lüğətlərinin istifadəsi;
- assosiativ sözlər çoxluğunun istifadəsi;
- ehtimala əsaslanan indeksləşdirmə;
- biblioqrafik məlumatların istifadəsi.
Yuxarıda sadalanan
üsullardan daha məşhuru sinonim-
lər və tezaurus lüğətlərinin istifadə olunması üsuludur. Bu
lüğətlər sinonim və ya ekvivalent sözlərin sinifləri çoxlu-
ğundan ibarət olur. Hər sinifdə bir-biri ilə sinonim və ya
tezaurus təşkil edən terminlər, eyni bir obyektin və ya hə-
rəkətin təsvirini verən, mənaca bir-birinə çox yaxın olan,
eyni mövzu sahəsinə aid edilən sözlər qruplaşdırılır.
Belə lüğətlərin istifadəsi axtarış prosesində sorğunun
hər hansı termininin müvafiq
sinonimlər sinfinin identi-
fikatoruna dəyişdirilməsinə imkan verir. Nəticədə verilmiş
hər hansı bir termin bu sinfə daxil olan terminlər çoxluğu
ilə əvəz edilmiş olur.
Terminlərin əlavə üst-üstə düşmələrini təmin etmək
üçün tətbiq olunan növbəti üsul
assosiativ sözlərin istifa-
dəsi üsuludur. Bu üsula əsasən
sorğuda göstərilən və sənə-
di təsvir edən hər bir termin üçün onunla assosiasiya təşkil
edən əlavə terminlər çoxluğu əlavə olunur.
Terminlərin assosiativlik göstəricisinin müəyyən edilməsi
üçün indeksləşdirmə üsullarından, məsələn, statistik üsuldan
istifadə etmək olar. Belə üsullara əsasən terminlər çoxluğu
üçün
n
m
ij
a
A
}
{
assosiativlik matrisi tərtib olunur. Bu
matrisin sətir və sütunlarının kəsişməsində yerləşən
ij
a
ele-
menti
i
və
j
terminləri cütü üçün assosiativlik
dərəcəsinin
(assosiativlik əmsalının) qiymətini müəyyən edir.
İki
i və
j terminlərinin assosiativlik əmsalı bu terminlə-
rin informasiya massivinin bütün sənədləri üzrə rast-
gəlinmə tezliklərinin hasillərinin cəmi şəklində hesablanır:
153
n
k
jk
ik
ij
f
f
a
1
,
(8.1)
burada
ij
a –
i və
j terminlərinin assosiativlik əmsalı,
ik
f
–
i
termininin
k sənədində rastgəlinmə tezliyi,
n – massivdə
olan sənədlərin sayıdır.
Yuxarıda qeyd olunduğu kimi,
i və
j terminlərinin
k
sənədində rastgəlinmə tezlikləri
ik
f
və
jk
f
[0,1] interva-
lında qiymətlər alır. Lakin (8.1) düsturuna uyğun olaraq,
hesablama
nəticəsində
ij
a
assosiativlik əmsalının qiyməti
çox böyük ola bilər. Ona görə də bu əmsalın qiymətini
normallaşdırmaq məqsədilə aşağıdakı düstur tətbiq olunur:
n
k
jk
ik
n
k
jk
n
k
ik
n
k
jk
ik
ij
f
f
f
f
f
f
a
1
1
2
1
2
1
(8.2)
Terminlərin assosiativlik göstəricilərinin qiymətləri üçün
sərhəd qiyməti müəyyən olunur. Əgər
ij
a
olarsa,
onda
i və
j terminləri assosiativ terminlər kimi qəbul olunur.
Ehtimala əsaslanan indeksləşdirmə zamanı əvvəlcə ter-
minlərin sənədlərdə mövcud olub-olmaması müəyyənləşdi-
rilir, bundan sonra terminlərlə sənədlər arasındakı münasi-
bətlərin əsasında bu terminlərə uyğun olan tematik siniflərin
identifikatorları həmin
sənədlərə mənimsədilir, yəni sənədlər
bu terminləri özündə saxlayan tematik siniflərə aid edilir.
Nəhayət,
biblioqrafik məlumatların istifadə olunması
üsulları açar sözlərin sayını artırmağa, bunun nəticəsində
isə axtarış prosesində əhatə olunan sənədlər dairəsini ge-
nişləndirməyə imkan verir. Biblioqrafik məlumatlar qis-
mində müəlliflərin soyadı, nəşriyyatların adı, sənədlərdə
154
rast
gəlinən istinadlar, sitatlar və s. kimi rekvizitlər istifadə
olunur. Onlar açar sözlər qismində sənədlərə (onların in-
dekslərinə) əlavə edilərək yazılır.
Dostları ilə paylaş: