4-
qadamda
biz Encoderlash amalini bajarishimiz kerak. Modelni o’qitish davomida biz raqamli
ma’lumotlar bilan ishlaganimiz uchun faqat raqamli ma’lumotlarga esa bo’lgan o’zgaruvchilarning
korrelyatsiya darakjasini aniqlandi.
Quyidagi kod orqali Datasetni encoder qilamiz va qayta korrelyatsion tahlil o’tkazamiz.
di = {
'M'
:
1
,
'B'
:
0
}
df.diagnosis = [di[item]
for
item
in
df.diagnosis ]
Bundan ko’rinib turibdiku eng ko’proq bog’liq to’lovlarga chekuvchilar ustunidir.
5-
qadam
normallashtirish bizning ma’lumotlarimiz kerak:
Bu yerda biz bashorat uchun ahamiyatga ega bo’lmagani uchun shu ustunni olib tashlaymiz.
Sklearn.procissing da standardscaler nomli funksiya orqali amallarni bajarishimiz mumkin bo’ladi.
6-
qadamda
ma’lumotlarimizni(datasetni) 2 qismga bo’lamiz. Test va train kabi ikki guruhga
bo’lamiz. Maqsad Datasetning katta qismi bilan ma’lumotni o’qitib qolgan qismi bilan uni
testlashimiz mumkin bo’ladi. Uning uchun quyidagi kodni yozishimiz kerak bo’ladi:
7-qadamda
biz modelni yaratamiz. Buning uchun sklearn kutubxonasidan foydalangan holda
quyidagi kodlarni yozishimiz kerak bo’ladi.
8-
qadamda
Endi modelni baholash uchun quyidagi Confusion matritsasini yaratamiz
9-
qadamda.
Bashorat natijasi olingandan so’ng, uni Accuracy, Precision Recall, F-1 Score
yordamida baholaymiz.
10-
qadamda.
Modelni grafik shaklda ifodalaymiz:
11-
qadamda.
Modelda eng yaxshi
n
ni topish uchun quyidagi kodni yozishimiz kerak bo’ladi:
eng yaxshi n qaysi ekanligini bilish uchun quyidagi kodni yozishimiz kerak:
Dastur natijasi sifatida 9 qiymati qaytdi n=9 da qanday natijaga ega bo’lganimizni bilish uchun esa
quyidagi kodni yozishimiz kerak bo’ladi:
Endiggi qadamda Xatolik grafini hosil qilish uchun quyidagi kodni yozishmiz kerak bo’ladi:
Bu grafikdan ko’rinib turibdiki qiymat n =9 da eng kam xatolikka erishayotgan ekanmiz.
Dostları ilə paylaş: |