Presendent bilan o’ragishda masalaning matematik qo’yilishi Obyektlar to’plami berilgan bo’lib, ular o’zaro kesishmaydigan va sinflarga bo’lingan. Obyektlar ta turli toifadagi alomatlar bilan tavsiflangan bo’lib, ularning tasi interval, tasi nominal shkalalarda o’lchanadi.
Tanlanma obyektlarining sinfga tegishligining umumlashgan baholari hisoblansin.
Ficherning Iris tanlanmasi
3: Ma’ruza. Taksonomiya usullari va tajriba berilganlarini boshlang‘ich tahlili
Klasterli tahlil (cluster analysis) – berilganlarni to‘plash, tanlov obyektlari haqidagi ma’lumotlarni saqlovchi va ularni bir jinsli guruhlarga nisbatan tartiblashni bajaruvchi ko‘p o‘lchamli statistik protseduradir. Klasterizatsiya masalalari “o‘qituvchisiz o‘rgatish” masalalari sinfiga kiradi.
Klasterli tahlil quyidagi asosiy vazifalarni bajaradi:
Turlarga ajratish yoki klassifikatsiyani qayta o‘tkazish;
Obyektlarni guruhlash uchun foydali konseptual sxemalar tadqiqoti;
Berilganlarni tadqiq qilish asosida gipotezalar topish;
Gipotezalarni tekshirish.
Klasterizatsiyaning maqsadi:
Berilganlarni klasterli strukturasini aniqlash orqali tushunish.
Tanlovni o‘xshash obyektlar guruhlariga ajratish va keyingi qadamda berilganlarga ishlov berish va qaror qabul qilishni osonlashtiradi. YA’ni, har bir klasterga mos tahlil usuli qo‘llaniladi (“ajratib ol va hukmronlik qil” strategiyasi).
Berilganlarni hajmini qisqartirish. Agar tanlov keragidan ortiq katta bo‘lsa, har bir klasterdan 1 tadan, eng katta o‘xshash vakil qoldiriladi.
Yangiliklarni aniqlash (novelty detection). Hech qaysi bir klasterga kirmaydigan guruhlanmagan obyektlarni ajratib olinadi.
Yuqorida qayd qilingan masalalar quyidagi holatlarda hal qilinadi:
Klasterlar sonini kamaytirishga harakat qilinadi;
Har bir klaster ichida obyektlar o‘xshashligi eng yuqori darajada bo‘lishi muhim, klasterlar soni istagancha bo‘lishi mumkin;
Eng katta e’tibor hech bir klasterga kirmaydigan obyektlarga qaratiladi.
Bu barcha holatda iyerarxik klasterizatsiya qo‘llash mumkin, ya’ni, katta klasterlar kichik klasterlarga, kichik klasterlar o‘z navbatida yana ham kichikroq klasterlarga va h.k. ajratilishi mumkin.
Bunday masalalar taksonomiya masalalari deyiladi. Taksonomiyaning natijasi daraxt ko‘rinishidagi iyerarxik struktura bo‘ladi.