x: bu avtomobilning kilometraj
ko’rsatkichi
y: avtomobil narxi
y = g(x|θ)
bu yerda g() – model
θ
0
va θ
1
– model parametrlari
Regressiyaga misol (Python muhitida)
Regressiyaga misol (nochiziqli)
1. x – obyekt parametri
Model ko’rinishi:
2. obyekt parametri
Model ko’rinishi:
O’qituvchili o’qitish algoritmlari
Linear Regression
Nearest Neighbor
Gaussian Naive Bayes
Decision Trees
Support Vector Machine (SVM)
Random Forest
Ma’lumotlar to’plami (Data set)
Data set - bu o’qitish uchun kerakli bo’lgan ma'lumotlar to'plamidir. Boshqacha
aytganda, ma'lumotlar to'plami ma'lumotlar bazasi jadvalining yoki bitta
statistik ma'lumotlar matritsasining qiymatlarini hisoblanib, bunda jadvalning
har bir ustuni ma'lum o'zgaruvchini yoki parametr (x1,x2,....,xn) qiymatini
ifodalasa, har bir satr esa berilgan parametrlar asosidagi obyekt qiymatiga (X1,
X2,....,XN) to'g'ri keladi.
Machine Learning loyihalarida biz o'quv ma'lumotlari to'plamidan (training data
set) foydalanamiz. Bu turli xil harakatlarni bajarish uchun modelni o’qitish uchun
ishlatiladigan haqiqiy ma'lumotlar to'plami hisoblanadi.
Ma’lumot to’plamlari (data set) turlari
Mashinani o’qitish jarayonida va modelning to’liq ishlashini ta’minlash
maqsadida quyidagi ma’lumotlar to’plami turlaridan foydalaniladi:
o’qituvchi to’plam, o’quv tanlanma (training set);
validatsiya to’plami (validation set);
testlash to’plami (testing set).
Ma’lumotlarga dastlabki ishlov berish
Ma’lumotlar turini belgilash (Format): O’qituvchi to’plamdagi ma’lumotlar
turi va toifasini moslashtirish (Misol uchun, o’qitiluvchi to’plam sifatida 100 t
rasm olingan bo’lsin, rasmlar har xil o’lchamda yoki har xil fayl formatida
bo’lishi mumkin).
Ma’lumotlarni tozalash (Data Cleaning): Ushbu bosqichda ma’lumotlar
orasidan ortiqcha yoki ahamiyati past bo’lgan (masalan, sifati juda past bo’lgan
tasvirlar, o’lchami juda kichik bo’lgan rasmlar), model turg’unligiga ta’sir
qiluvchi ma’lumotlar olib tashlanadi.
Ushbu bosqichda o’qituvchi
to’plamdagi ma’lumotlar xususiyatlari o’rganib chiqiladi va bashoratlash,
tashxislash, sinflashtirish, qaror qabul qilish uchun kerakli xususiyatlar ajratib
olinadi. (Misol uchun rasmda “olma” tasvirlanganligini belgilab beruvchi
xusisyatlar).
Ma’lumotlarga dastlabki ishlov berish
Unsupervised learning
O’qituvchisiz o’qitish (unsupervised learning) – bu mashinani o’qitish usulidan
biri bo’lib, bunda modelni oldindan aniq bo’lgan ma’lumotlar bilan o’qitish
amalga oshirilmaydi, aksincha obyekt parametrlarini (ma'lumotlarni) topish
uchun modelga o'z ustida ishlashga imkon yaratib beriladi.
Supervised
learning
usuliga
qaraganda
murakkab
usul
hisoblanadi
va
bashoratlash jarayoni avtomatik lekin noaniqroq bo’lishi mumkin.
Unsupervised learning usulida asosan “klasterlash” masalasi yechiladi.
Unsupervised learning
Unsupervised learning: “Klasterlash”
Unsupervised learning turlari
Clustering
◦
Hierarchical clustering
◦
K-means clustering
◦
K-NN (k nearest neighbors)
◦
Principal Component Analysis
◦
Singular Value Decomposition
◦
Independent Component Analysis
Artificial intelligance with ML
Foydalanilgan adabiyotlar
Aurelian Geron, Hands on Machine Learning with Scikit-Learn
Keras&Tensorflow // Second edition Concepts, Tools, and Techniques to Build
Intelligent Systems, 2019, 510 pages
https://www.geeksforgeeks.org/ml-machine-learning/
https://www.geeksforgeeks.org/ml-types-learning-supervised-learning/
https://www.guru99.com/unsupervised-machine-learning.html
Dostları ilə paylaş: |