x uchun bitta “Maqolalar soni” ustunini o‘zlashtirdim. y uchun esa “Monografiya” ustunni o‘zlashtirib oldim. Bizni datasetda boshida 25tasi 2-toifa keyin 25tasi 1-toifa va oxirgi 25tasi oliy toifali o‘qituvchilar bo‘lgani uchun alohida qilib yozib oldim.
4-rasm. Dataset grafiki.
Yarattilgan datasetni matplotlib kutubxonasi yordamida ikkita (Maqolalar soni va Monografiya) xususiyatininng grafigi chizildi.
Sklearn kutubxonasidan foydalangan holda KMeans klasterlash modelini quring(klasterlar sonini variantdan oling).
rasm. KMeans klasterlash.
Sklearn kutubxonsidan Kmeans klasterlashni chaqirib olamiz.
rasm. Kmean.cluster_centers_center.
Kmeans klasterlashda berilgan datasetimizning xuxusiyatlaridan kelib chiqib uning marrkazlarini topishimiz kerak boladi shuning uchun uning markazlarini aniqladim.
rasm. Kmeans klasterlash da uning sinflarini oldik.
4. Model tomonidan aniqlangan klaster markazlarini va ob’yektlarini grafik tarvirlang.
9-rasm. Sinflari va klasterlashdagi grafigi kodi.
Bu rasmda berilgan datasetimizning orginal grafigi yani sinflashtirilgandagi grafigi va klasterlashdagi grafigini solishtirish uchun mo‘ljallangan dastur kodi.
10-rasm. Solishtirma grafik.
Bu yerda sinflarim bilan Kmeans klasterlashni solishtirilgan grafigi tasvirlangan bunda biz bergan sinflardagi xususiyati boyicha chizilgan grafigi bilan farqi borligi uchun uni rivojlantirish kerak.
rasm. Klasterlashdagi kamchiliklarni togrilash.
Avval berilgan klasterlashni moslashtirish uchun uning qiymatini ozgartitib olganmiz va uning qiymatini sinflashtirishdagi qiymatlariga moslashtirib olyapmiz.
12-rasm. Sinflari va klasterlashdagi grafigi kodi.
Bu rasmda berilgan datasetimizning orginal grafigi yani sinflashtirilgandagi grafigi bilan klasterlashdagi grafigini togrilangan holatidagi solishtirish uchun mo‘ljallangan dastur kodi.
13-rasm. Solishtirma grafik.
Bu yerda sinflarim bilan Kmeans klasterlashni solishtirilgan grafigi tasvirlangan bunda biz bergan sinflardagi xususiyati boyicha chizilgan grafigi bilan klasterlashda chizilgan grafigi bir biriga moslab qayta chizilgan grafik.
5. Modelini o’rgatuvchi to’plamdagi aniqligini hisoblang va tartibsizlik matritsasi (confusion_matrix) ni quring. Klasterlash aniqligini baholang.
rasm. Confusion matrix.
Confusion matrix tuzildi.Bunda 1-sinf bo‘yicha 35ta togri baholagan 1 ta 2-sinf va 1ta 3-sinf bilan adashgan.
2-sinf bo‘yicha 34ta togri baholagan 1 ta 1-sinf bilan adashgan.
3-sinf bo‘yicha 22tatogri baholagan 6ta 1-sinf bilan adashgan.
Biz qurgan datasetimiz mukammaligi tekshirib korganimizda uning togri qurilganiligini kordik va biz qurgan dataset 91% togri qurilgan.