Orfoqrafik səhvlərin aşkarlanması üsulları. Orfoqrafik səhvlərin aşkarlanması üçün bir çox metodlar vardır.
A. Lüğətlə axtarış texnikası. Bu metodla mətndəki sözlər əvvəlcədən müəyyən qaydaya əsasən hazırlanmış lüğətdə
axtarılır və əgər hər hansı söz lüğətdə yoxdursa həmin söz səhv olaraq proqram tərəfindən istifadəçiyə bildirilir. Bu
metodun çatışmayan cəhəti hər hansı söz baza lüğətdə olmazsa bu zaman proqram onu səhv söz kimi çıxardacaq.
B. N-gram analiz. Sözlərin n-gram tezliyi dedikdə dildə sözün hansı tezliklə işlənilməsi başa düşülür. N-nin
qiymətindən asılı olaraq birtərtibli, ikitərtibli, üçtərtibli, dördtərtibli ola bilər. Ümumiyyətlə sözlərin n-qram tezliyi metodu
əvvəlcədən n-qram üçün statistik hazırlanmış cədvəldə axtarış etməklə işləyir.
Orfoqrafik səhvlərin redaktə üsulları. Orfoqrafik səhvləri korreksiyası üçün bir çox metodlar vardır.
A. Ən kiçik redaktə məsafəsi (Minimum Edit Distance).- bir sətri başqa sətrə çevirmək üçün lazım olan minimum
əməliyyatların sayıdır.Verilmiş söz lüğətdəki hər bir söz ilə qarşılaşdırılır və ən kiçik redaktə məsafəsi tapılır. Müqayisədən
sonra düzgün alternativ kimi minimum məsafəli olan söz seçilir. Bu metod üçün alqoritmlər var:Levenşteyn
alqoritmi,Hamminq alqoritmi,ən uzun alt sətrin tapılması alqoritmi və s.
Dostları ilə paylaş: |