Ishdan maqsad: Mashinali o’qitishda sinflashtirish algoritmlari va ularni dasturlash. Nazariy qism Sinflashtirish tushunchasi, mashinali o’qitishning asosiy yondashuvlaridan biri sifatida deb qaraymiz
Ishdan maqsad: Mashinali o’qitishda sinflashtirish algoritmlari va ularni dasturlash.
Nazariy qism
Sinflashtirishtushunchasi, mashinali o’qitishning asosiy yondashuvlaridan biri sifatida deb qaraymiz, sinflashtirish masalasi uchun logistik va softmax regressiya funksiyalaridan foydalaniladi.
Sinflashtirish - berilgan ma'lumotlar punktlari sinfini bashorat qilish jarayoni. Sinflar ba'zan maqsadlar / yorliqlar yoki toifalar deb nomlanadi. Sinflashtirishni bashorat qiluvchi modellashtirish (f) xaritalash funktsiyasini kirish o'zgaruvchilaridan (X) diskret chiqish o'zgaruvchilariga (y) yaqinlashtirish vazifasidir.
K ta-yaqin qo’shnilar usuli. K ta yaqin qo’shnilar usuli(k-nearest neighbours, k-NN) boshqa usullardan farqli ravishda o’qitish(train) fazasini talab qilmaydi[7]. Sinflashtirish masalasini yechish usuli ko’p ulchovli belgilar to’plamidan eng ko’p topilgan k ta yaqin qo’shnilarni sinflarga ajratish hisoblanadi. Bu sinflashtirish modellarini o’qitishning eng oddiy algoritmlardan biridir. K soni - bu belgilar sohasidagi sinflanadigan ob'ektlar bilan taqqoslanadigan qo'shni ob’ektlar sonidir. Boshqacha aytganda agar k=10 bo’lsa unda har bir ob’ekt oz’ining 10-ta qo’shnisi orasidagi masofa bilan solishtiriladi. Usul Data Mining texnologiyalarida sinflashtirish masalasini yechish uchun qo’llaniladi.
O’qitish jarayonida algoritm barcha vektor belgilarini va unga mos sinf lebellarini oddiy tarzda eslab qoladi.
Algoritm: Test to’plamidagi har bir ob’ektni sinflashtirish uchun kema-ket ravishda qo’yidagi amallarni bajarish zarurdir:
L1 ni tartibga solish koeffitsientlarning mutlaq qiymatlari yig'indisiga teng jarima qo'shadi.
L2 ni tartibga solish koeffitsient qiymatlarining kvadratchalarining yig'indisiga teng jarima qo'shadi
Taroq regression modeli va Lasso regression modeli tartibga solingan lineer modellardir, bu modelni qayta o'qitishni kamaytirish va tartibga solishning yaxshi usuli: uning erkinlik darajasi qanchalik kichik bo'lsa, ma'lumotlarni qayta tayyorlash qiyinroq bo'ladi. Polinom modelini tartibga solishning oddiy usuli-polinom darajalari sonini kamaytirishdir.