Ikkilamchi guruhlash
. Guruhlashning xususiy turi bo’lib ikkilamchi guruhlash
hisoblanadi. Ikkilamchi guruhlash deb oldingi tuzilgan guruhlar asosida yangi guruhlar
tuzish operatsiyasiga aytiladi. Agarda birlamchi guruhlashda statistik kuzatishning
boshlang’ich ma’lumotlari asosida guruhlar tuzilsa, ikkilamchi guruhlash dastlabki
guruhlash oraliqlarini yiriklashtirish va oraliqlarning nisbatiga asoslanib yangi guruhlarni
hosil qilish usullarida amalga oshiriladi.
Faraz qilaylik, Chilonzor tumanida 100 ta do’kon bor. Ular inkassatsiya qilish summalari
bo’yicha 10 guruhga ajratilgan: 100 ming so’mgacha; 100-200; 200-300;
300-400; 400-500; 500-600; 600-700; 700-800; 800-900; 900 va yuqori. Bu intervallar
oralig’ini ikki baravarga yiriklashtirib quyidagi guruhlarni hosil qilish mumkin: 200 ming
so’mgacha; 200-400; 400-600; 600-800; 800 va undan yuqori.
Ikkilamchi guruhlashning boshqa usullari ham qo’llanilishi mumkin. Bu qo’yilgan
maqsad va vazifaga bog’liq.
Ko’p o’lchamli guruhlash (klaster-tahlil)
. Keyingi paytlarda guruhlash bir vaqtning
o’zida bir necha belgi orqali amalga oshirilmoqda. Buning o’zi guruhlash metodini ko’p
o’lchamli tahlilga aylanib borishidan darak beradi. Ma’lumki, ko’p o’lchamli guruhlashda
yoki klaster – tahlilida kuzatish ob’ektlarini xohlangan belgilar soni bo’yicha bir jinsli
guruhlarga birlashtirish mumkin. Shunisi qiziqki kuzatilayotgan ob’ekt sifatida iqtisodiy
birliklar-korxonalar yoki belgilarning o’zi qatnashishi mumkin.
Klaster-tahlil algoritmlari ikki asos bo’ladigan paytni hisobga olgan holda ishlab
chiqiladi:
1.
Bir turlilikni, yoki “o’xshamas” ob’ektlarni ifodalovchi belgilarning geometrik
maydonda juda ko’p nuqtalarni tiqis to’plamini ko’rsatib berish sharoitlarini.
2.
Geometrik maydonda ikki turli ob’ektlar bir-biridan bir muncha uzoqlikda
joylashgan va ular orasidagi masofa qancha uzoqlashsa, ular shuncha o’xshamas va
qancha yaqinlashsa ularning o’xshashligi shunga ortadi; nollik variant hamma vaqt
qandaydir bir ob’ektdan o’zigacha, bu erda to’liq o’xshashlik.
Aniq algoritmni tanlashga qaramasdan, klaster-tahlil quyidagi qadamlarni birin- ketinlik
bilan bajarish sharoitida amalga oshiriladi:
a)
X boshlang’ich ma’lumotlarni nxm razmerdagi matritsalarini tuzish, bu erda n
–
kuzatish ob’ektlari soni; m – guruhlashtiruvchi belgilar soni;
b)
boshlang’ich ma’lumotlar matritsalaridan normalashtirilgan ma’lumotlar
matritsalariga o’tish (z). Bu masalani echilishi bilan o’z tabiati bo’yicha turli bo’lgan
belgilar bitta asosga keltiriladi. O’tish har bir qiymatni qayta hisoblash Xij va Zij quyidagi
variantlar
orqali
amalga oshadi.
ij
ij
ij
x
j
(max)
x
j
(min)
_
1. Z
=
ij
x
j
;
x
x
2. Z =
ij
;
3. Z =
x
ij
;
ij
4. Z =x
i
(max);
x
ij
j
j
x
ij
(
эталон
)
_
5. Z =
x
ij
x
j
.
v) barcha juft ob’ektlar orasidagi masofani aniqlash (d
ij
) va dastlabki matritsalar
masofasini tuzish (D
0
). Kuzatish ob’ektlari o’rtasidagi masofani hisoblash uchun bir
qancha metriklar (i
1
- norma; Minkovskiy; Evklidovo masofa; Maxalanobis)
mavjud. Ularni qaysi birini tekshiruvchining xohishiga bog’liq.
g) klaster-tahlilni aniq protsedurasi tanlanadi va matritsa (D
0
) ma’lumotlari bo’yicha
birin-ketinlik bilan bir turli guruhlar ajratiladi. Eslatib qo’ymoqchimiz, hozirgi
kunda klasterlashni 200 dan ortiq turli xil protseduralari mavjud. Ularniquyidagi 6
ta guruhga bo’lish mumkin: ierarxik klaster-tahlil; guruhlashning iterativ metodlari;
zichlikning model qiymatini izlash metodlari; omiliy metodlar; quyuqlashishni
izlash metodlari; graflar nazariyasini qo’llovchi metodlar.
Yuqorida keltirilgan qadamlar faqat miqdoriy o’lchovga ega bo’lgan belgilar tahlil
qilingan paytda qo’llaniladi. Agarda tahlilda tartibli (ranglar) va boshqa sifat
ko’rsatkichlar qatnashsa, keltirilgan algoritmdan oldin nomiqdoriy ma’lumotlarni
oqifrovkalash etaplari birma-bir bajariladi.
Dostları ilə paylaş: |