,
64
.
0
12
,
1
.
1
13
,
56
.
0
14
.
Buradan görünür ki, əvvəlki nümunədən fərqli olaraq, K
4
tematik kataloqu verilmiş sənədə daha relevantdır. Belə ki:
56
.
0
min
1
4
,
1
14
l
l
.
194
Qeyd olunmalıdır ki, K
2
tematik kataloqunun orta kvad-
ratik uzaqlaşma əmsalının qiyməti
14
əmsalından çox cü-
zi böyükdür, ona görə də bu kataloqu da d
1
sənədinə rele-
vant kataloq kimi qəbul etmək olar.
7.3. İstifadəçinin qeyri-səlis sorğusuna əsasən daha
relevant sənədlərin axtarılması alqoritmi
Yuxarıda qeyd olunduğu kimi, istifadəçinin sorğuları
axtarış əlamətlərini müəyyən edən açar sözlərdən və ya
terminlərdən tərtib olunur. Əvvəlki paraqraflarda istifadəçi
sorğusu
H
h
t
Q
kimi işarə edilmişdi.
İndekslər bazasında sənədlərin təqdim olunması forma-
tına uyğun olaraq, İAS axtarış prosesinin əvvəlində istifa-
dəçi sorğularını da müvafiq formata çevirir. Sorğuya daxil
edilmiş hər bir açar sözün və ya terminin həmin sorğuya
münasibəti müəyyən edilir. Başqa sözlə, açar sözlərin tərtib
edilmiş sorğu üçün vaciblik dərəcəsi göstərilir. Ümumiy-
yətlə, sorğu qeyri-səlis münasibət şəklində təqdim olunur:
,
,H
h
Q
t
Q
h
t
h
1
/
.
(7.14)
"Sorğu-termin" münasibəti isə aşağıdakı kimi müəyyən
edilir:
H
h
T
t
T
T
Q
r
R
Q
h
Q
D
t
H
Q
h
Q
h
,
1
,
,
1
,
0
:
, (7.15)
burada
Q
T
– Q sorğusunu təşkil edən terminlər çoxluğu,
Q
h
t
h
– t
h
termininin Q sorğusu üçün vaciblik
əmsalı,
Q
h
r
– t
h
termini ilə Q sorğusu arasındakı qeyri-səlis
münasibətdir.
195
Bundan əlavə, İAS axtarış prosesinə başlamazdan qabaq
Q
T
çoxluğunu normallaşdırır, yəni T çoxluğunun
Q
T
çox-
luğunda olmayan terminlər bu çoxluğa əlavə olunur, lakin
onların vaciblik əmsallarının qiyməti sıfıra bərabər qəbul
edilir. Onda (7.15) düsturu aşağıdakı şəkli almış olur:
,
,J
, h
,
T
: T
R
Q
T
h
QT
1
1
0
J
QT
h
QT
r
R
,
(7.16)
burada
olarsa.
0,
olarsa,
,
Q
h
Q
h
h
T
h
T
t
T
t
Axtarışın dolğunluğunu və dəqiqliyini yaxşılaşdırmaq
üçün sorğunun terminlərinin sinonimləri çoxluğundan isti-
fadə etmək olar:
J
h
T
S
Q
h
T
t
Q
h
,
1
,
~
T
Q
.
(7.17)
Uyğun olaraq,
,J
, h
ν
T
h
jh
,J
j
h
1
max
~
1
.
(7.18)
Sonralar Q sorğusundan danışdıqda fərz edəcəyik ki, o,
Q
T
normallaşdırılmış və tamamlanmış qeyri-səlis çoxluqdur.
İndi isə belə qeyri-səlis Q sorğusuna əsasən informasi-
yanın axtarılması məsələsinə baxaq. Aydındır ki, axtarışın
nəticəsi istifadəçi sorğusuna daha relevant olan sənədlərin
siyahısından ibarət olacaqdır, yəni:
G
g
R
d
I
.
(7.19)
Belə ki,
I
i
D
i
Q
D
Q
R
T
T
T
T
I
,
1
.
(7.20)
196
Q sorğusuna daha relevant sənədlərin müəyyənləş-
dirilməsi üçün (7.18) məsələsi (7.1) məsələsinə analogiya
təşkil edir və onun həlli üçün də Belman-Zadə yanaşma-
sından istifadə etmək olar.
D
i
R
və
Q
R
münasibətlər çoxluqlarının kəsişməsi d
i
sə-
nədinin Q sorğusuna relevantlıq dərəcəsini verir, yəni:
Q
D
i
DQ
i
R
R
R
.
(7.21)
Əgər
J
,
1
I
,
1
,
R
ij
DQ
i
j
i
(7.22)
olarsa, onda çoxluqların kəsişməsinin tapılması qaydasına
uyğun olaraq,
J
I
j
ij
ij
,
1
,
,
1
,
j
i
, (7.23)
burada
ij
– t
j
termininə görə d
i
sənədinin Q sorğusuna re-
levantlıq dərəcəsidir.
Tutaq ki,
ab
d
– Q sorğusuna ideal dərəcədə relevant
olan abstrakt sənəddir. Onda t
j
termininə görə
ab
d
sənədi-
nin Q sorğusuna relevantlıq dərəcəsini aşağıdakı kimi
müəyyən etmək olar:
J
ij
I
i
ab
j
,
1
,
max
,
1
j
,
(7.24)
İndi isə hər bir sənəd üçün sorğunun bütün açar
sözlərini nəzərə almaqla
J
j
I
i
ij
,
1
,
,
1
,
əmsallarının
J
j
ab
j
,
1
,
əmsallarından ümumi orta kvadratik uzaq-
laşmasını hesablayaq. Bunun üçün aşağıdakı düsturdan is-
tifadə etmək olar:
197
I
i
J
J
J
j
ij
ab
j
i
,
1
,
1
2
.
(7.25)
Sorğuya "ideal uyğun sənəddən" (abstrakt sənəddən)
minimal uzaqlaşmaya malik olan sənəd ən relevant sənəd
olacaqdır:
i
I
i
,
1
*
min
.
(7.26)
(7.23)-(7.26) məsələsinin həlli yeganə ən relevant
*
d
sənədini tapmağa imkan verir. Lakin praktikada, adətən,
yalnız bir ən relevant sənədi deyil, müəyyən relevantlıq
dərəcəsi olan bütün sənədləri tapmaq tələb olunur.
Bu məsələnin həlli üçün relevantlığın sərhəd qiymətini
–
parametrini daxil edək. Onda
I
i
i
,
1
,
(7.28)
şərtlərini ödəyən bütün sənədləri verilmiş sorğuya relevant
qəbul edəcəyik.
Aşağıdakı nümunənin köməyi ilə üsulun adekvatlığını
göstərək.
Tutaq ki,
8
.
0
/
,
8
.
0
/
,
95
.
0
/
9
5
3
t
t
t
Q
– istifadəçi
sorğusu,
5
4
3
2
1
,
,
,
,
d
d
d
d
d
D
isə informasiya fəzasının
axtarış sistemi tərəfindən indeksləşdirilmiş sənədləri
çoxluğudur.
İndeksləşdirmə
nəticəsində
10
9
8
7
6
5
4
3
2
1
,
,
,
,
,
,
,
,
,
t
t
t
t
t
t
t
t
t
t
T
çoxluğunun terminləri
ilə d
j
sənədləri arasında aşağıdakı münasibətlər aşkar
olunmuşdur:
198
}
9
.
0
/
;
0
/
;
8
.
0
/
;
0
/
;
7
.
0
/
;
0
/
;
8
.
0
/
;
9
.
0
/
;
0
/
;
7
.
0
/
{
)
/
(
10
9
8
7
6
5
4
3
2
1
1
1
t
t
t
t
t
t
t
t
t
t
t
d
j
j
,
}
0
/
;
8
.
0
/
;
0
/
;
0
/
;
9
.
0
/
;
9
.
0
/
;
0
/
;
8
.
0
/
;
0
/
;
6
.
0
/
{
)
/
(
10
9
8
7
6
5
4
3
2
1
2
2
t
t
t
t
t
t
t
t
t
t
t
d
j
j
,
}
0
/
;
7
.
0
/
;
0
/
;
0
/
;
0
/
;
9
.
0
/
;
0
/
;
9
.
0
/
;
6
.
0
/
;
0
/
{
)
/
(
10
9
8
7
6
5
4
3
2
1
3
3
t
t
t
t
t
t
t
t
t
t
t
d
j
j
,
}
0
/
;
6
.
0
/
;
0
/
;
8
.
0
/
;
7
.
0
/
;
9
.
0
/
;
0
/
;
0
/
;
0
/
;
0
/
{
)
/
(
10
9
8
7
6
5
4
3
2
1
4
4
t
t
t
t
t
t
t
t
t
t
t
d
j
j
,
}
8
.
0
/
;
0
/
;
0
/
;
6
.
0
/
;
0
/
;
0
/
;
0
/
;
9
.
0
/
;
7
.
0
/
;
6
.
0
/
{
)
/
(
10
9
8
7
6
5
4
3
2
1
5
5
t
t
t
t
t
t
t
t
t
t
t
d
j
j
.
Q
T
çoxluğunu T çoxluğunun elementləri ilə aşağıdakı
kimi tamamlamaq olar:
0
/
,
8
.
0
/
,
0
/
,
0
/
,
0
/
,
8
.
0
/
,
0
/
,
95
.
0
/
,
0
/
,
0
/
10
9
8
7
6
5
4
3
2
1
t
t
t
t
t
t
t
t
t
t
T
Q
.
(7.23) düsturuna əsasən
ij
əmsallarını tapaq:
0
0
0
0
0
0
0
86
.
0
0
0
0
48
.
0
0
0
0
72
.
0
0
0
0
0
0
56
.
0
0
0
0
72
.
0
0
86
.
0
0
0
0
64
.
0
0
0
0
72
.
0
0
76
.
0
0
0
0
0
0
0
0
0
0
86
.
0
0
0
ij
Onda (7.24) düsturunun köməyi ilə
J
j
ab
j
,
1
,
əmsa-
lının qiymətini hesablayaq:
199
0
64
.
0
0
0
0
72
.
0
0
86
.
0
0
0
ab
j
.
(7.25) düsturundan:
68
.
0
41
.
0
06
.
0
05
.
0
82
.
0
i
qiymətləri, (7.28) düsturundan isə
05
.
0
*
alınır. Buradan görünür ki, d
2
sənədi verilmiş sorğuya da-
ha relevantdır. Əgər sərhəd qiymətlərini
1
.
0
qəbul et-
sək, onda verilmiş D sənədlər çoxluğundan d
2
və d
3
sənəd-
ləri sorğuya relevant olar.
Dostları ilə paylaş: |