Laboratoriya mashquloti №1,2 Mavzu: O`qituvchili(Nazorat ostidagi) va o`qituvchisiz (Nazoratsiz) ta`lim

Yüklə 1,24 Mb.

səhifə	8/8
tarix	13.06.2023
ölçüsü	1,24 Mb.
	#129589

1 2 3 4 5 6 7 8

1-2-lob ishi

Chiqish:

Yorliq kodlash
Yorliq kodlash modelni tushunishi uchun kategorik qiymatlarni raqamli qiymatlarga aylantirish uchun ishlatiladi.
Python 3
df.columnsdagi col uchun:
agar df[col].dtype == ob'ekt:
le = LabelEncoder()
df[col] = le.fit_transform(df[col])
Issiqlik xaritasi ma'lumotlar to'plamining turli xususiyatlari o'rtasidagi bog'liqlikni vizualizatsiya qilishning eng yaxshi usuli hisoblanadi. Keling, unga 0,8 qiymatini beramiz
Python 3
plt.figure(figsize=(15, 15))
sb.heatmap(df.corr() > 0,8, annot=True, cbar=False)
plt.show()

Chiqish:
Standartlashtirish
Standartlashtirish - bu xususiyat muhandisligining ajralmas qismi bo'lgan xususiyatlarni masshtablash usuli. U ma'lumotlarni kichraytiradi va mashinani o'rganish modeliga undan o'rganishni osonlashtiradi. U o'rtacha qiymatni "0" ga va standart og'ishni "1" ga kamaytiradi.
Python 3
skaler = StandardScaler()
ma'lumotlar = scaler.fit_transform(df)
Segmentatsiya
T-tarqatilgan Stokastik qo'shni joylashtirishdan foydalanamiz . Bu yuqori o'lchamli ma'lumotlarni vizuallashtirishga yordam beradi. U ma'lumotlar nuqtalari orasidagi o'xshashlikni qo'shma ehtimollarga aylantiradi va qiymatlarni past o'lchamli joylashtirishga kamaytirishga harakat qiladi.
Python 3
sklearn.manifold import TSNE dan
model = TSNE(n_komponentlar=2, tasodifiy_state=0)
tsne_data = model.fit_transform(df)
plt.figure(figsize=(7, 7))
plt.scatter(tsne_data[:, 0], tsne_data[:, 1])
plt.show()
Chiqish:

Albatta, berilgan ma'lumotlarning 2 o'lchovli tasviridan aniq ko'rinadigan ba'zi klasterlar mavjud. Keling, yuqori o'lchamli tekislikning o'zida ushbu klasterlarni topish uchun KMeans algoritmidan foydalanamiz.
KMeans Klasterlash tekislikdagi turli nuqtalarni klasterlash uchun ham ishlatilishi mumkin.
Python 3
xato = []
(1, 21) oraliqdagi n_klasterlar uchun:
model = KMeans(init='k-means++',
n_clusters=n_clusters,
max_iter=500,
tasodifiy_state=22)
model.fit(df)
error.apppend(model.inertia_)
Bu erda inersiya klasterlar ichidagi kvadrat masofalar yig'indisidan boshqa narsa emas.
Python 3
plt.figure(figsize=(10, 5))
sb.lineplot(x=diapazon(1,21), y=xato)
sb.scatterplot(x=diapazon(1,21), y=xato)
plt.show()
Chiqish:

Bu erda tirsak usulidan foydalanib, k = 6 klasterlarning optimal soni, deb aytishimiz mumkin, chunki k = 6 dan keyin inertsiya qiymati keskin kamaymaydi.
Python 3
# optimal k=5 bilan klasterlash modelini yaratish
model = KMeans(init='k-means++',
n_klasterlar=5,
max_iter=500,
tasodifiy_state=22)
segmentlar = model.fit_predict(df)
Scatterplot KMeans Clustering tomonidan tuzilgan barcha 6 klasterni ko'rish uchun ishlatiladi.
Python 3
plt.figure(figsize=(7, 7))
sb.scatterplot(tsne_data[:, 0], tsne_data[:, 1], rang=segmentlar)
plt.show()
Chiqish:

Adabiyotlar:
1. Oliver Theobald, “Machine Learning for Absolute Beginners”, second edition, 7. Galushkin A. I. Neural networks: fundamentals of theory. – M.: Hotline–. 2017, 128 pages
2. . Peter Flach, Machine Learning. The science and art of building algorithms that extract knowledge from data”: M-2017, 400 pages, ISBN 978-5-97060-273-7.3.

Saytlar
1. https://www.geeksforgeeks.org/customer-segmentation-using-unsupervised-machine-learning-in-python
4. https://www.geeksforgeeks.org/supervised-unsupervised-learning

Yüklə 1,24 Mb.

Dostları ilə paylaş:

1 2 3 4 5 6 7 8