5.2. Axtarışın dolğunluğunun yaxşılaşdırılması
üsulları
İstifadəçi öz sorğusuna hər hansı dərəcədə aidiyyəti olan
bütün mümkün sənədlər çoxluğunu əldə etmək istədikdə ax-
tarışın dolğunluğunun yaxşılaşdırılması üsulları tətbiq olu-
nur. Məsələn, ekspert tərəfindən onu maraqlandıran sahəyə
aidiyyəti olan bütün patentlərin axtarılması sorğusuna mü-
fəssəl cavabın alınması arzusu buna nümunə ola bilər.
Axtarışın dolğunluq göstəricisinin yaxşılaşdırılması
üçün tətbiq olunan üsullar istifadəçinin sorğusunun açar
sözləri ilə informasiya massivində olan sənədlərin termin-
lərinin əlavə üst-üstə düşməsini təmin etməyə imkan verir.
Bu məqsədlə sorğuların və sənədlərin açar sözləri və ter-
minləri ya başqa terminlərlə əvəz olunur, ya da onlara ye-
niləri əlavə olunur. Başqa sözlə, sorğuların və sənədlərin
terminlər çoxluğu genişləndirilir.
Terminlər çoxluğunun genişləndirilməsi üçün bir neçə
üsul tətbiq olunur:
152
- sinonimlər və tezaurus lüğətlərinin istifadəsi;
- assosiativ sözlər çoxluğunun istifadəsi;
- ehtimala əsaslanan indeksləşdirmə;
- biblioqrafik məlumatların istifadəsi.
Yuxarıda sadalanan üsullardan daha məşhuru sinonim-
lər və tezaurus lüğətlərinin istifadə olunması üsuludur. Bu
lüğətlər sinonim və ya ekvivalent sözlərin sinifləri çoxlu-
ğundan ibarət olur. Hər sinifdə bir-biri ilə sinonim və ya
tezaurus təşkil edən terminlər, eyni bir obyektin və ya hə-
rəkətin təsvirini verən, mənaca bir-birinə çox yaxın olan,
eyni mövzu sahəsinə aid edilən sözlər qruplaşdırılır.
Belə lüğətlərin istifadəsi axtarış prosesində sorğunun
hər hansı termininin müvafiq sinonimlər sinfinin identi-
fikatoruna dəyişdirilməsinə imkan verir. Nəticədə verilmiş
hər hansı bir termin bu sinfə daxil olan terminlər çoxluğu
ilə əvəz edilmiş olur.
Terminlərin əlavə üst-üstə düşmələrini təmin etmək
üçün tətbiq olunan növbəti üsul assosiativ sözlərin istifa-
dəsi üsuludur. Bu üsula əsasən sorğuda göstərilən və sənə-
di təsvir edən hər bir termin üçün onunla assosiasiya təşkil
edən əlavə terminlər çoxluğu əlavə olunur.
Terminlərin assosiativlik göstəricisinin müəyyən edilməsi
üçün indeksləşdirmə üsullarından, məsələn, statistik üsuldan
istifadə etmək olar. Belə üsullara əsasən terminlər çoxluğu
üçün
n
m
ij
a
A
}
{
assosiativlik matrisi tərtib olunur. Bu
matrisin sətir və sütunlarının kəsişməsində yerləşən
ij
a
ele-
menti
i
və
j
terminləri cütü üçün assosiativlik dərəcəsinin
(assosiativlik əmsalının) qiymətini müəyyən edir.
İki i və j terminlərinin assosiativlik əmsalı bu terminlə-
rin informasiya massivinin bütün sənədləri üzrə rast-
gəlinmə tezliklərinin hasillərinin cəmi şəklində hesablanır:
153
n
k
jk
ik
ij
f
f
a
1
,
(8.1)
burada
ij
a – i və j terminlərinin assosiativlik əmsalı,
ik
f
– i
termininin k sənədində rastgəlinmə tezliyi, n – massivdə
olan sənədlərin sayıdır.
Yuxarıda qeyd olunduğu kimi, i və j terminlərinin k
sənədində rastgəlinmə tezlikləri
ik
f
və
jk
f
[0,1] interva-
lında qiymətlər alır. Lakin (8.1) düsturuna uyğun olaraq,
hesablama nəticəsində
ij
a
assosiativlik əmsalının qiyməti
çox böyük ola bilər. Ona görə də bu əmsalın qiymətini
normallaşdırmaq məqsədilə aşağıdakı düstur tətbiq olunur:
n
k
jk
ik
n
k
jk
n
k
ik
n
k
jk
ik
ij
f
f
f
f
f
f
a
1
1
2
1
2
1
(8.2)
Terminlərin assosiativlik göstəricilərinin qiymətləri üçün
sərhəd qiyməti müəyyən olunur. Əgər
ij
a
olarsa,
onda i və j terminləri assosiativ terminlər kimi qəbul olunur.
Ehtimala əsaslanan indeksləşdirmə zamanı əvvəlcə ter-
minlərin sənədlərdə mövcud olub-olmaması müəyyənləşdi-
rilir, bundan sonra terminlərlə sənədlər arasındakı münasi-
bətlərin əsasında bu terminlərə uyğun olan tematik siniflərin
identifikatorları həmin sənədlərə mənimsədilir, yəni sənədlər
bu terminləri özündə saxlayan tematik siniflərə aid edilir.
Nəhayət, biblioqrafik məlumatların istifadə olunması
üsulları açar sözlərin sayını artırmağa, bunun nəticəsində
isə axtarış prosesində əhatə olunan sənədlər dairəsini ge-
nişləndirməyə imkan verir. Biblioqrafik məlumatlar qis-
mində müəlliflərin soyadı, nəşriyyatların adı, sənədlərdə
154
rast gəlinən istinadlar, sitatlar və s. kimi rekvizitlər istifadə
olunur. Onlar açar sözlər qismində sənədlərə (onların in-
dekslərinə) əlavə edilərək yazılır.
Dostları ilə paylaş: |