2.Klasterlash vazifasi. Klasterlashtirishning maqsadi - ob'ektlar to'plamini ular o'rtasida biron -bir bog'liqlik bor yoki yo'qligini aniqlash, guruhlash esa yangi ob'ekt qaysi sinfga tegishli ekanligini oldindan belgilangan sinflar guruhidan topishga qaratilgan.
Klasterlash va tasniflash o'xshash ko'rinishi mumkin, chunki ikkala ma'lumotni qidirish algoritmlari ma'lumotlar to'plamini kichik guruhlarga ajratadi, lekin ular ma'lumot yig'ishda ishonchli ma'lumotni olish uchun ikki xil o'qitish texnikasi. Klasterlash va tasniflashning farqi shundaki, klasterlash - bu xuddi shunday misollarni xususiyatlariga qarab guruhlaydigan nazorat qilinmaydigan o'qitish usuli, tasniflash - bu xususiyatlarga qarab misollarga oldindan belgilangan teglarni belgilaydigan nazorat qilinadigan o'quv texnikasi.
"Klaster" tushunchasini aniq belgilash mumkin emas, bu klasterlash algoritmlari juda ko'p bo'lishining sabablaridan biridir.[5] Umumiy belgi mavjud: ma'lumotlar ob'ektlari guruhi. Biroq, turli tadqiqotchilar turli xil klaster modellarini qo'llaydilar va ushbu klaster modellarining har biri uchun yana turli xil algoritmlarni berish mumkin. Klaster tushunchasi, turli xil algoritmlar tomonidan topilgan bo'lib, uning xususiyatlarida sezilarli darajada farq qiladi. Ushbu "klaster modellari" ni tushunish turli algoritmlar o'rtasidagi farqlarni tushunishning kalitidir.
3.Klasterlash kriteriyalari. "Klaster" mohiyatan bunday ma'lumotlar guruhining to'plamidir, odatda ma'lumotlar to'plamidagi barcha moslamalarni o'z ichiga oladi. Bundan tashqari, u klasterlarning bir-biriga bog'liqligini, masalan, bir-biriga o'rnatilgan klasterlar ierarxiyasini ko'rsatishi mumkin. Klasterlarni quyidagicha ajratish mumkin:Qattiq klaster: har bir ob'ekt klasterga tegishli yoki yo'qYumshoq klasterlash (shuningdek: loyqa klasterlar): har bir ob'ekt har bir klasterga ma'lum darajada tegishli (masalan, klasterga tegishli bo'lish ehtimoli)Bundan tashqari, aniqroq farqlar mavjud, masalan:Qattiq bo'linishni klasterlash: har bir ob'ekt to'liq bitta klasterga tegishliCheklovchilar bilan qat'iy bo'linishni klasterlash: ob'ektlar hech qanday klasterga tegishli bo'lishi mumkin emas va hisobga olinadi chetga chiquvchilarBir-birini takrorlovchi klasterlash (shuningdek: muqobil klasterlash, ko'p ko'rinishda klasterlash): ob'ektlar bir nechta klasterga tegishli bo'lishi mumkin; odatda qattiq klasterlarni o'z ichiga oladiIerarxik klasterlash: bolalar klasteriga tegishli ob'ektlar ham ota-ona klasteriga tegishliSubspace klasterlash: bir-biriga o'xshash klaster, noyob belgilangan pastki bo'shliq ichida, klasterlar bir-birining ustiga chiqmasligi kutilmoqda.
Klasterlash natijalarini baholash (yoki "tasdiqlash") klasterlashning o'zi kabi qiyin.[33] Ommabop yondashuvlar "ichki"baholash, bu erda klasterlash yagona sifat baliga umumlashtiriladi"tashqi"baholash, bu erda klaster mavjud" asosiy haqiqat "tasnifi bilan taqqoslanadi,"qo'llanma"inson mutaxassisi tomonidan baholash va"bilvosita"klasterlashning maqsadga muvofiq dasturida foydaliligini baholash orqali baholash.[34]Ichki baholash choralari muammolarni boshdan kechirmoqda, chunki ular o'zlarini klaster vazifasi sifatida ko'rishlari mumkin bo'lgan funktsiyalarni ifodalaydi.