Mashinaviy o'qitishda Klasterlash
Nazoratsiz o'qitish - bu tasniflanmagan va etiketlanmagan ma'lumotlardan
foydalangan holda mashinani o'qitish va algoritmga ushbu ma'lumotlarga
ko'rsatmalarsiz harakat qilish imkonini beradi. Bu erda mashinaning vazifasi
saralanmagan ma'lumotlarni o'xshashliklari, naqshlari va farqlari bo'yicha
ma'lumotlarni oldindan tayyorlamasdan guruhlashdir.
Nazorat ostidagi ta'limdan farqli o'laroq, hech qanday o'qituvchi taqdim
etilmaydi, bu mashinaga hech qanday ta'lim berilmaydi. Shuning uchun mashina
yorliqsiz ma'lumotlardagi yashirin tuzilmani o'zi topishi belgilangan.
Nazoratsiz o’qitish algoritmi ikki toifaga bo'linadi:
Klasterlash
Assotsiatsiya
Klasterlash yoki
klaster tahlili - bu yorliqsiz ma'lumotlar to'plamini
guruhlaydigan mashinani o'qitish usuli. Buni
"Ma'lumotlar nuqtalarini o'xshash
ma'lumotlar nuqtalaridan tashkil topgan turli klasterlarga guruhlash usuli. Bunda
mumkin bo'lgan o'xshashliklarga ega bo'lgan ob'ektlar boshqa guruh bilan kamroq
yoki umuman o'xshashliklarga ega bo'lmagan guruhda qoladi" deb ta'riflanishi
mumkin .
Klasterlash nazoratsiz o'qitish usuli, shuning uchun algoritmga hech qanday
nazorat berilmaydi va u etiketlanmagan ma'lumotlar to'plami bilan shug'ullanadi.
Ushbu klasterlash texnikasini qo'llaganingizdan so'ng, har bir klaster yoki
guruh klaster-identifikatori bilan ta'minlanadi. Mashinaviy o’qitish tizimi katta va
murakkab ma'lumotlar to'plamlarini qayta ishlashni soddalashtirish uchun ushbu
identifikatordan foydalanishi mumkin.
Klasterlash usuli odatda
statistik ma'lumotlarni tahlil qilish uchun
ishlatiladi.
Klasterlash tasniflash algoritmiga o'xshaydi , ammo farq biz
foydalanayotgan ma'lumotlar to'plamining turida. Tasniflashda biz etiketli
ma'lumotlar to'plami bilan ishlaymiz, klasterlashda esa yorliqsiz ma'lumotlar
to'plami bilan ishlaymiz.
Klasterlash texnikasi turli vazifalarni bajarishda keng qo'llanilishi mumkin:
Bozor segmentatsiyasi
Statistik ma'lumotlarni tahlil qilish
Ijtimoiy tarmoqlarni tahlil qilish
Tasvir segmentatsiyasi
Anomaliyalarni aniqlash va boshqalar.
Quyidagi diagramma klasterlash algoritmining ishlashini tushuntiradi. Turli
xil mevalar o'xshash xususiyatlarga ega bo'lgan bir nechta guruhlarga
bo'linganligini ko'rishimiz mumkin.