4-
qadamda
biz Encoderlash amalini bajarishimiz kerak. Modelni o’qitish
davomida biz raqamli
ma’lumotlar bilan ishlaganimiz uchun faqat raqamli ma’lumotlarga esa bo’lgan o’zgaruvchilarning
korrelyatsiya darakjasini aniqlandi.
Quyidagi kod orqali Datasetni encoder qilamiz va qayta korrelyatsion tahlil o’tkazamiz.
di = {
'M'
:
1
,
'B'
:
0
}
df.diagnosis = [di[item]
for
item
in
df.diagnosis ]
Bundan ko’rinib turibdiku eng ko’proq bog’liq to’lovlarga chekuvchilar ustunidir.
5-
qadam
normallashtirish bizning ma’lumotlarimiz kerak:
Bu yerda biz bashorat uchun ahamiyatga ega bo’lmagani uchun shu ustunni olib tashlaymiz.
Sklearn.procissing da standardscaler nomli funksiya orqali amallarni bajarishimiz mumkin bo’ladi.
6-
qadamda
ma’lumotlarimizni(datasetni) 2 qismga bo’lamiz. Test
va train kabi ikki guruhga
bo’lamiz. Maqsad Datasetning katta qismi bilan ma’lumotni o’qitib
qolgan qismi bilan uni
testlashimiz mumkin bo’ladi. Uning uchun quyidagi kodni yozishimiz kerak bo’ladi:
7-qadamda
biz modelni yaratamiz. Buning uchun sklearn kutubxonasidan foydalangan holda
quyidagi kodlarni yozishimiz kerak bo’ladi.
8-
qadamda
Endi modelni baholash uchun quyidagi Confusion matritsasini yaratamiz
9-
qadamda.
Bashorat natijasi olingandan so’ng, uni Accuracy,
Precision Recall, F-1
Score
yordamida baholaymiz.
10-
qadamda.
Modelni grafik shaklda ifodalaymiz:
11-
qadamda.
Modelda eng yaxshi
n
ni topish uchun quyidagi kodni yozishimiz kerak bo’ladi:
eng yaxshi n qaysi ekanligini bilish uchun quyidagi kodni yozishimiz kerak:
Dastur natijasi sifatida 9 qiymati qaytdi n=9 da qanday natijaga ega bo’lganimizni
bilish uchun esa
quyidagi kodni yozishimiz kerak bo’ladi: