O‘zMU xabarlari Вестник НУУз ACTA NUUz
FILOLOGIYA
1/4/1 2023
- 250 -
2-rasm.
Tabiiy tilni qayta ishlash (NLP) komponentlari.
1.
Leksik tahlil.
Leksik tahlil jarayonida matnning
butun qismi abzatslar, gaplar va soʻzlarga ajratiladi. Bu
jarayon soʻzlarning
tuzilishini aniqlash, tahlil qilish va
matndagi noharfiy belgilarni aniqlab, ularni oʻchirishga
erishiladi.
2.
Morfologik tahlil.
Bu jarayonda so‘zlar va
so‘zshakllarni ularning lug‘atdagi shakli (leksikon)
bilan
taqqoslash, asosi (lemmasi) va so‘zlarning grammatik
shakllari (formant / affiks / affiksal morfemalari) aniqlanadi
hamda ularga tavsif beriladi [2:24]
3.
Sintaktik tahlil.
Sintaktik tahlil gapdagi soʻzlarni
grammatik jihatdan tahlil qiladi va soʻzlar oʻrtasidagi
bogʻlanish munosabati aniqlanadi. Masalan,
dastur bazasiga
tushum kelishigidagi soʻz oʻtimli fe’l bilan bogʻlanishi haqida
qoida berilganligi natijasida
“Doʻkonni uyga boradi”
gapida
tushum kelishigidagi soʻz (doʻkonni) joʻnalish kelishigidagi
soʻz bilan notoʻgʻri bogʻlangani aniqlanadi.
4.
Semantik tahlil.
Semantik tahlil soʻzlarning
gapda muayyan oʻrinda qoʻllanganini e’tiborga olib,
uning
ma’nosini beradi va matn mazmunini tahlil qiladi. Bu jarayon
lingvistik bazada soʻzlarning semantik valentliklari, aniqroq
aytgada, muayyan soʻzning chap va oʻng tomondagi semantik
jihatdan maqbul birikuvchi soʻzlari
berilgan baza muhim
sanaladi. Shundagina “
issiq muzqaymoq
” soʻz birikmasi,
“
Togʻda mushuk oʻtlab yuribdi
” jumlasi semantik jifatdan xato
ekanligi aniqlanadi.
5.
Dostları ilə paylaş: