P aniqlik va R to’liqlikning o’rta vaznli garmonik o’rtacha qiymati sifatida
aniqlanadigan F-o’lchovdan foydalaniladi:
Odatda F-o’lchov quyidagi ko’rinishda ifodalanadi:
Axborotni ajratib olish
Axborotni ajratib olish (angl.
information extraction) — bu komp’yuterda tayyorlangan
aniq strukturaga ega bo’lmagan yoki kuchsiz strukturalashgan hujjatlardan aniq
struturaga ega bo’lgan ma’lumotlarni avtomatik ajratib olish yoki qurish.
Axborotni ajratib olish tabiiy tildagi matnlarni qayta ishlab bilan bog’liq bo’lib,
axborotlarni qidirishning bir ko’rinishi hisoblanadi.
“Kecha, 2019 yil 31 noyabr kuni Toshkent shahrida o’tkaziladigan Shanxay hamkorlik
tashkilotiga a’zo davlatlarning hukumat rahbarlari uchrashuvida ishtirok etish uchun
Rossiya Federatsiyasining bosh vaziri Dmitriy Medvedov Toshkent shahriga keldi”
Rasmiy vizit (davlat -Kim, Davlat-Kimga, kelish sanasi)
Ma’lumotlarni bunday akslantirishdan
asosiy maqsad – boshlang’ich tarqoq (xatotik)
axborotlarni ma’lumotlarni qayta ishlashning standart usullari yordamida tahlil qilish
imkonini yaratishdan iborat. Shu bilan birgalikda xabar matnida tavsiflangan
mantiqiy
qonuniyatlarni aniqlash masalasi usun xizmat qilishi mumkin.
Axborotlarni ajratib olishning maxsus masalalari:
Nomlangan (ya’ni, muhim, tayanch) elementlarni tanish, masalan: odamlar ismi, tashkilot
nomlari, geografik nomlar, vaqt va pul birliklari va h.k.
Anaformalar va o’zaklarning aniqlanishi: bitta va aynan shu ob’etga tegishli (daxldor)
bog’liqliklarni aniqlash. Bunday bog’lanishlarning xos holatlari – olmoshli anaforalar.
Atamalarni (terminlarni) ajaratish: berilgan matn uchun kalit so’zlari va iboralarni topish.
Dostları ilə paylaş: