Ikki sinflar obrazlarni anglash masalasida , obyektning umumlashgan bahosi quyidagi formula bilan hisoblanadi
(9)
bu yerda va nominal alomat gradatsiyasи to‘plamga tegishli, –
(10)
mezon bo‘yicha alomat bo‘yicha -ustunlik intervali,
– tegishlilik funksiyasi va u quyidagicha hisoblandi
(11)
Бу ерда мос равишда i-интервалдаги ва синф объектлари сони.
Агар (номинал) бўлса, у ҳолда (11) даги – мос равишда i градациянинг ва синфлардаги сони.
Misol. Gipertoniya kasalligida alomatlarning ustunlik intervallari.
1: Ёши: [17..38] f(x)=0,03 [39..80] f(x)=0,83
2: Буйи: [174..185] f(x)=0,33 [186..194] f(x)=0,9 [152..173] f(x)=0,57
3: Вазни: [48..73] f(x)=0,12 [74..114] f(x)=0,81 [47..47] f(x)=0,76
4: Систолик артериал босим (АДС): [140..220] f(x)=0,97 [90..135] f(x)=0
5: Диастолик артериал босим (АДД): [90..130] f(x)=0,94 [60..85] f(x)=0,08
6: ЭКГга нисбатан RR интервал узунлиги:
[0,72..0,92] f(x)=0,43 [0,94..1,06] f(x)=0,64 [1,08..1,20] f(x)=0,20
[1,28..1,28] f(x)=1,00 [0,6..0,7] f(x)=0,63
Ustunlik intervallari asosida umumlashgan baholarni hisoblash
Obyekt(sinf)
|
UB
|
Obyekt(sinf)
|
UB
|
26(1):
|
1,000
|
74(2):
|
0,263
|
30(1):
|
0,953
|
73(2):
|
0,242
|
3(1):
|
0,946
|
58(2):
|
0,233
|
11(1):
|
0,902
|
86(2):
|
0,227
|
19(1):
|
0,889
|
78(2):
|
0,216
|
...
|
...
|
...
|
...
|
27(1):
|
0,616
|
56(2):
|
0,022
|
33(1):
|
0,609
|
141(2):
|
0,021
|
8(1):
|
0,605
|
38(2):
|
0,019
|
9(1):
|
0,592
|
60(2):
|
0,016
|
32(1):
|
0,578
|
50(2):
|
0,016
|
7(1):
|
0,563
|
49(2):
|
0,001
|
2(1):
|
0,517
|
61(2):
|
0,000
|
O‘rgatuvchi tanlanma seleksiyasidan maqsad – anglash algoritmlarining, ular sifatining asosiy ko‘rsatkichi bo‘lgan umumlashtirish qobiliyatini oshirishdir. Seleksiya natijasida berilganlarni sinflash samarasi oshishiga va ularning tabiatini chuqurroq tushunishga olib keladi.
Masalaning bunday qo‘yilishiga obrazlarni anglash va mashinali o‘rganish sohalarida zarurat bor: matnlarni kategoriyalash, masofadan skanerlash, narkotik giyohlarni aniqlash, marketing, nutqni anglash, qo‘lyozma belgilarini anglash, tibbiyot va shu boshqalarda. Ayniqsa, juda katta o‘lchamdagi berilganlarga (jumladan, big data) ishlov berish masalalarida, xususan, alomatlar soni haddan katta va tanlanma hajmi nisbatan kichik bo‘lgan hollarda.
Tanlanma seleksiyasi ikki tomonlama olib borilishi mumkin - alomatlar fazosini qisqartirish va tanlanma shovqin obyektlarini o‘chirishdir, oxirgisi berilganlarni senzuralash deb nomlanadi.
Tahlil qilinuvchi alomatlarni korrektlash uchun sabab sifatida quyidagilarni keltirish mumkin:
– o‘rganish samaradorligini oshirish va hisoblash resurslarini qisqartirish hisobiga sinflash algoritmalarini qo‘llash (ishlov berish vaqti va kerak bo‘lmagan alomatlarni xotirada saqlashdan qutilish);
– faqat anglash uchun zarur bo‘lgan berilganlarni yig‘ish (o‘lchash) hisobiga berilganlarni to‘plash jarayoni sarf harajatini kamaytirish;
– sinflash sifatini oshishi uchun zamin yaratish;
– berilganlar tabiatini yanada yaqqolroq tushunish orqali klassifikator tavsifini soddalashtirish;
– predmet soha mutaxassislariga yuz berayotgan jarayonlar mohiyatini tushuntirish imkoniyatini taqdim etish.
Alomatlar seleksiyasi bir qancha usullarda amalga oshirilishi mumkin, masalan, informativ alomatlar to‘plam ostisini ajratib olish, alomatlar kombinsaiyasi (alomatlar juftliklari uchun), chiziqli va nochiziqli o‘girishlar asosida yangi, hajmi kichikroq latent alomatlar fazosini qurish, ma’lum mezon asosida alomatlarni guruhlash (aglomerativ guruhlash qoidasi bilan).
Tanlanma senzurasi shovqin obyektlarni o‘chirish orqali yoki yangi alomatlar fazosiga o‘tish orqali amalga oshirilishi mumkin. Bu amallarning barchasi berilganlarga dastlabki ishlov berish deb nomlanadi.
Obrazlarni anglash tizimlarida berilganlarga dastlabki ishlov berish ketma-ket jarayon bo‘lib, quyidagilarni o‘z ichiga oladi:
shovqinlarni, o‘tkazib yuborilgan (o‘lchanmagan) qiymatlarni va past sifati berilganlarni o‘chirishni o‘z ichiga oluvchi berilganlarni tozalash;
reduksiya va transformatsiya usullari asosida obyektlarni tavsiflash uchun minimal informativ alomatlarni to‘plam ostini saralab olish orqali berilganlarni zichlashtirish;
evristik algoritmlar yordamida hajmni qisqartirish va boshlang‘ich ma’lumotlarni saqlab qolishga imkon beruvchi berilganlarni birlashtirish.
Bir qator anglash algoritmlarida tanlanmada shovqin obyektlar va sachratqi-obyektlar bo‘lishi hisobga olingan. Masalan qarorlar daraxtini quruvchi algoritmlarda sachratqi-obyektlardan qurilgan, past statistik ishonchli daraxt ostilarini o‘chiruvchi reduksiya algoritmlari, noto‘g‘ri sinflangan obyektlarni aniqlashda obyektlarning lokal xususiyatlarni inobatga oluvchi algoritmlar, tanlanmani tavsiflashning sifat mezonini optimallashtirish uchun obyektalarni ketma-ket o‘chirish usullarini misol keltirish mumkin.
Dostları ilə paylaş: |