171
Bu parametrlər terminlərin ehtimal olunan çəki əmsal-
larıdır və terminlərin sənəddə faktiki mövcudluğu əsasında
hesablanır. Sənədlərin relevantlığı binar
xassə olduğundun
P
rel
=1-P
nrel
qəbul edilmişdir.
Beləliklə, nəticədə bu modeldə sənədlər
d binar vektoru
ilə təsvir olunur. Sənədlərin indeksləşdirilməsi zamanı te-
matik rubrikatorda olan terminlərin istifadə olunub-olun-
maması faktı bu vektor vasitəsilə müəyyən edilir. Onun
əsasında isə sənədlərin relevantlıq və ya qeyri-relevantlıq
vəziyyətlərini
müəyyən edən s
1
və
s
2
əmsalları hesablana-
raq müvafiq sənədlərə mənimsədilir.
d sənədinin istifadəçinin sorğusuna relevant və ya qey-
ri-relevant olması ehtimalını Bayes düsturu ilə aşağıdakı
kimi ifadə etmək olar:
d
P
s
P
s
d
P
d
s
P
i
i
i
/
/
,
(6.6)
burada
i
s
P
– sənədin relevantlığının (
i=1) və ya qeyri-
relevantlığının (
i=2) apriori ehtimalıdır,
i
s
d
P
/
– axtarış
nəticəsində verilmiş sənədlər arasından həmin sənədin re-
levant (i=1) və ya qeyri-relevant (i=2) olması ehtimalıdır.
Tam ehtimal düsturuna görə:
2
2
1
1
/
/
s
P
s
d
P
s
P
s
d
P
d
P
. (6.7)
i
s
d
P
/
kəmiyyətinin hesablanması və axtarış funksi-
yasına daxil edilməsi məqsədilə sorğularda
olan termin-
lərin çəkilərinin müəyyən olunması üçün aşağıdakı müla-
hizələr əsasında qurulmuş mexanizmdən istifadə olunur:
- sənədlərin indeksləşdirilməsi zamanı terminlər bir-
birindən asılı olmadan istifadə olunur;
- sənədin sorğuya relevantlığı ehtimalı sorğuya daxil
edilmiş terminlərin sənədin axtarış obrazlarında
olub-olmaması əsasında qiymətləndirilir.
172
Bu mülahizələrin əsasında aşağıdakı çəki funksiyası
daxil edilir:
i
i
i
i
i
i
i
r
n
r
r
r
r
n
n
r
w
log
, (6.8)
burada,
n – informasiya massivində olan sənədlərin sayı,
i
n
–
i
t
termini rast gəlinmiş sənədlərin ümumi sayı,
r –
informasiya massivində istifadəçi sorğusuna relevant olan
sənədlərin sayı,
i
r
–
i
t
termini
rast gəlinmiş relevant sə-
nədlərin sayı.
i
r
,
r və
i
n
kəmiyyətlərinin qiymətləri çox kiçik və ya
sıfır olduqda
i
r
kəmiyyəti
5
.
0
r
i
ilə əvəz oluna bilər.
i
r
və
r kəmiyyətlərinin müəyyən edilməsi üçün qabaq-
cadan bəlli olan və sonradan istifadəçi
ilə əks əlaqə yolu
ilə dəqiqləşdirilən qiymətlər istifadə olunur.
Bundan əlavə, informasiya massivinin ayrı-ayrı hissələri
üzrə alınmış nəticələr də istifadə oluna bilər. İstifadəçi ilə
əks əlaqə olmadıqda, sistem tərəfindən avtomatik olaraq re-
levantlıq ehtimalının ən böyük qiyməti mənimsədilmiş sə-
nədlərin relevant sənədlər kimi qəbul edilməsi və bunun
əsasında qiymətləndirmənin aparılması mümkündür.
Dostları ilə paylaş: