O’zbekiston respublikasi axborot texnologiyalari


Umumiy shartlari e'tiborsizlik: to'xtatish so'zlar



Yüklə 114,89 Kb.
səhifə6/7
tarix13.12.2023
ölçüsü114,89 Kb.
#175373
1   2   3   4   5   6   7
1-mustaqil ish XS

. Umumiy shartlari e'tiborsizlik: to'xtatish so'zlar


Ba'zan qadriyatlarni ifodalovchi juda keng tarqalgan so'zlar foydalanuvchilarning axborot ehtiyojlarini qondirish odatda chiqarib tashlanadi Leksikon. Ular to'xtash so'zlari (stop-words) deb ataladi. Odatda, stop-Word ro'yxatlarini yaratish uchun atamalar to'plamdagi chastotada (hujjatlar to'plamidagi atamalarning takrorlanishining umumiy soniga teng) va keyin tez-tez tartibga solinadi ko'pincha semantik hisobga olgan holda qo'l bilan filtrlangan atamalar indekslangan hujjatlarning predmeti bilan bog'liq bo'lgan aloqalar indekslangan elementlar bekor qilingan stop belgilari (stop-list) ro'yxatiga kiritilgan. Misol ro'yxati so'zlarni to'xtatish shakl.

Normalizatsiya (sinflarga ko'ra atamalarni tasniflash ekvivalentlik)


Sizning hujjatingiz va so'rovingiz allaqachon leksemalarga bo'linishini aytaylik. Eng oddiy holatda, so'rovdagi belgilar hujjatning belgilariga to'g'ri keladi. Biroq, juda tez-tez ikki belgi ketma-ketligi aniq emas, lekin teng deb hisoblanadi. Misol uchun, agar siz AQSh so'zini qidirsangiz, u holda AQSh qisqartmasi bo'lgan hujjatlarni ham ko'rishni xohlashingiz mumkin. Lexemlarni normalizatsiya qilish (token normalization) belgilar ketma — ketligi o'rtasidagi ahamiyatsiz farqlarni bartaraf etish uchun leksemalarni kanonik shaklga olib kelish jarayonidir. 8 normalizatsiya qilishning eng keng tarqalgan usuli, odatda, ularning a'zolaridan biri nomi bilan ataladigan ekvivalentlik sinflarini (Equivalence classes) bevosita yaratishdan iborat.

Xulosa


  1. Ma’lumotlarni qayta ishlashda va ma’lumotlarni ma’lumotlar bazasiga joylashtirishda qo’llaniladi.

  2. Bu masalalar bilan malumotlarni intelletual tahlil qilish (data mining) shug’ullanadi.

  3. Internetning rivojlanish kontseptsiyasi: Har bir hujjatga semantik to’r deb ataluvchi XML formatidagi meta ma’lumotli fayl biriktiriladi va juda istiqbolli hisoblanadi. Lekin bu hujjatning o’zini almashtirish (o’zgartirish) emasligini e’tiborga olish kerak.

Yüklə 114,89 Kb.

Dostları ilə paylaş:
1   2   3   4   5   6   7




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin