AQT tomonidan topilgan hujjatlar so’rovga qanchalik mos kelishini baholashning ko’plab usullari mavjud. Afsuski, so’rovlarning muvofiqlik darajasi, boshqacha aytganda relevantnosti, sub’ektiv tushuncha hisoblanadi, muvofiqlik darajasi esa so’rov bajarilishi natijalarini baholovchi aniq insonga bog’liq.
Aniqlik (precision)
Bu AQTlari tomonidan topilgan tegishli hujjatlar sonining topilgan hujjatlarning umumiy soniga nisbati sifatida aniqlanadi:
To’liqlik (recall)
Topilgan relevant hujjatlar sonining bazadagi umumiy relevant hujjatlar soniga nisbati:
Tushish (qatordan chiqish) (fall-out)
fall-out relevant bo’lmagan manbalarni topish ehtimolini tavsiflaydi va topilgan relevant bo’lmagan hujjatlar sonining ma’lumotlar bazasidagi relevant bo’lmagan hujjatlarning umumiy soniga nisbati sifatida aniqlanadi:
F-o’lchov (F-measure, Van Rizbergen o’lchovi)
P aniqlik va R to’liqlikning o’rta vaznli garmonik o’rtacha qiymati sifatida aniqlanadigan F- o’lchovdan foydalaniladi:
OdatdaF-o’lchov quyidagi ko’rinishda ifodalanadi:
Axborotni ajratib olish
Axborotni ajratib olish (angl. information extraction) — bu kompyuterda tayyorlangan aniq strukturaga ega bo’lmagan yoki kuchsiz strukturalashgan hujjatlardan aniq struturaga ega bo’lgan ma’lumotlarni avtomatik ajratib olish yoki qurish.
Axborotni ajratib olish tabiiy tildagi matnlarni qayta ishlab bilan bog’liq bo’lib, axborotlarni qidirishning bir ko’rinishi hisoblanadi.