İnformatikanin əsaslari


Mətni axtarış prinsipləri



Yüklə 1,28 Mb.
səhifə141/156
tarix16.12.2023
ölçüsü1,28 Mb.
#182397
növüDərs
1   ...   137   138   139   140   141   142   143   144   ...   156
nformatikanin saslari

Mətni axtarış prinsipləri


Müasir mətn axtarışı sistemlərinin mürəkkəbliyinin mənbələri. Müasir sistemlər deskriptorlarla və ya sənəddəki atributlarla (nəşr ili, müəllifi, nəşriyyat və s.) işləyən əvvəlki axtarış sistemlərindən fərqli olaraq sənədin məzmunu ilə iş görür.
Təbii dildə verilən cümlə və ya ifadə çox hallarda ikimənalı və bolluqlu olur. Sinonimləri, omonimləri, qramatik forma müxtəlifliklərini nəzərə almaq lazım gəlir. Cümlədəki sözlər arasındakı məna əlaqələri çox zaman əyani olmur. Yeni terminlər və anlayışlar yaranır. Bütün bunlar mətni informasiya resurslarının strukturlaşdırılmama- sına dəlalət edir.
Sənədlərin təqdimatı. Mətni axtarış sistemlərində saxlanan sənəd kolleksiyaları olduqca iri ola bilir. Sənəddəki mətnlər də iri həcmli ola bilir. Buna görə də bütün mətnin təhlili səmərəli deyil. Vəziyyətdən çıxış yolu sənədin struktur təqdimatı ilə, başqa sözlə, sənədin təqdimat nümayəndələri ilə işləməkdən ibarətdir.
Sənədlərin indeksləşdirilməsi. Sənədlərin təqdimatı onların xassələri (atributları) çoxluğu ilə yaradılır. ―Dublin nüvəsi‖ (DC 1.1) adlanan beynəlxalq standartda sənədin təqdimatı 15 metaverilən elementlə verilir:
Title (resursun adı);
Creator (resursu hazırlayan və buna məsul olan şəxs, təşkilat və ya şöbə);
Subject (resursun məzmununda müzakirə edilən mövzu); Deskription (resursun məzmununun sərbəst formada təsviri); Publisher (resursa müraciət təmin edən şəxs, təşkilat, şöbə);
Contributor (Creator-da göstərilənlərdən əlavə, resursun hazırlanmasında iştirak edənlər);
Date (resursun yaradılması və ya təqdim edilməsi tarixi); Type (resursun janrı, kateqoriyası və digər xarakteristikaları); Format (resurs təqdimatının xarakteri);
İdentifier (resursa dəqiq iqtibas);
Source (resursun götürüldüyü mənbəyə iqtibas);
Language (resursun təqdimat dili);
Relation (verilənlərlə əlaqəli resursa iqtibas);
Coverage (resursun aid olduğu sahə, zaman və s.);
201
Rights (resursa intellektual mülkiyyət hüququ).
Kvalifikatorlar – metaverilən elementlərin semantikasının dəqiqləşdiriciləri ―Dublin nüvəsi‖ndəki qeyri-müəyyənlikləri aradan qaldırır. Məsələn, Date elementi üçün yaradıl- ma tarixi, müraciət tarixi kimi dəıqiqləşdirmə etmək olar.
Sənədlə assosiasiyalanmış ixtiyarı atribut indeksləşdirilmiş xassə adlanır. Bu xassələrə əsasən axtarış sistemində verilənlərin köməkçi strukturu qurulur ki, bunun köməyi ilə sənədin bütün məzmununa baxmadan lazımi sənədi axtarıb tapmaq olur. Köməkçi struktur indeks, göstərilən atributların sənədlə assosiasiyalanması propsesi sənədin indeksləşdirilməsi adlanır.
Köhnə axtarış sistemlərində deskriptor adlanan ayrı-ayrı söz və söz birləşmələrin- dən istifadə olunurdu. Deskriptor sənədin axtarış obrazı idi. Bu sistemlər deskriptorlu sistem adlanırdı. Deskriptorlu sistemlər hələ də istifadə edilir.
Sənədlərin indeksləşdirilməsi sənədin annotasiyası və ya tam mətni əsasında müəllif tərəfindən adi qaydada, ya da sənədin kompüter təhlili yolu ilə avtomatik həyata keçirilir. İstifadəçi sorğularının təqdimatı. Mətni axtarış sistemlərinin digər mühüm məsə-
ləsi istifadəçi sorğularının məzmununun strukturlaşdırılmış təqdimatıdır. Sorğuların təqdimatı da sənədlərin təqdimatına uyğun prinsiplərdən çıxış edərək hazırlanır. Əks halda sorğu ilə axtarış obyektini müqayisə etmək mümkün olmaz.

Yüklə 1,28 Mb.

Dostları ilə paylaş:
1   ...   137   138   139   140   141   142   143   144   ...   156




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin