* Kompaniya kvartiraning elektr energiyasi uchun to'lovini oldindan aytib
berishni xohlaydi, bu erda tafsilotlar - kvartiralarning soni,
ishlatilayotgan maishiy texnika, uydagi odamlar soni va boshqalar. Ushbu
o'zgaruvchilar yordamida elektr energiyasi uchun hisob-kitob qilish mumkin
bashorat qilingan.
Yuqoridagi misolda ko'p o'zgaruvchan regressiya qo'llaniladi, bu erda bizda
juda ko'p mustaqil o'zgaruvchilar va bitta bog'liq o'zgaruvchiga ega
Xarajat funksiyasi nima?
Xarajat funktsiyasi bu model kuzatilgan ma'lumotlardan farq qilganda
namunalarga xarajat qilish imkonini beradigan funktsiya. Ushbu tenglama
bashorat qilingan qiymat va haqiqiy qiymat o'rtasidagi farq kvadratining
yig'indisi, ma'lumotlar to'plamining uzunligining ikki baravariga bo'linadi.
MSE =
Ko'p o'zgaruvchan regressiya tahlilining bosqichlari
Ko'p o'zgaruvchan regressiya tahlili uchun bosqichlarni tanlash - bu
xususiyatlarni tanlash va
ularni normallashtirish, yo'qotish funktsiyasi va uni
minimallashtirishdan iborat.
* Xususiyatni tanlash
Xususiyatlarni tanlash ko'p o'zgaruvchan regressiyaning muhim
bosqichidir. Xususiyat tanlovi, shuningdek, o'zgaruvchan tanlov sifatida
ham tanilgan. Yaxshi model yaratish uchun muhim o'zgaruvchilarni tanlash
biz uchun muhim ahamiyat kasb etadi.
Normalizatsiya xususiyatlari
Biz funktsiya ma’lumotlarini ko’paytirishimiz kerak, chunki u ma'lumotlarning
umumiy tarqalishini va nisbatlarini saqlaydi. Bu samarali tahlilga olib keladi. Har
bir xususiyatning qiymati ham o'zgarishi mumkin.
Yo'qotish funktsiyasini minimallashtirish
Ma'lumotlar to'plamida yo'qotishlarni minimallashtirish bu Gradient tushishi
algoritmi asosida olib boriladi. Misol uchun quyidagicha berilgan bo’lsa,
Y =2+3x biz uni xosila
olish orqali
Y =4x+3 ko’rinishida yechamiz.
Ko'p o'zgaruvchan regressiyaning afzalliklari
Ko'p o'zgaruvchan regressiyaning eng muhim ustunligi bu ma'lumotlar
to'plamida mavjud bo'lgan qo'shimcha va mustaqil o'zgaruvchilar o'rtasidagi
o'zaro bog'liqlikni tushunishga yordam beradi. Ko'p o'zgaruvchan chiziqli
regressiya - bu keng qo'llaniladigan mashinalarni o'rganish algoritmi.
Ko'p o'zgaruvchan regressiyaning kamchiliklari
Ko'p o'zgaruvchan texnikalar biroz murakkab va yuqori darajadagi
matematik hisoblashni talab qiladi.
Ko'p o'zgaruvchan regressiya modelining natijasini ba'zan izohlash oson
emas, chunki u bir xil bo'lmagan yo'qotish va xatolik ehtimolligiga ega.
Ushbu modelni kichik ma'lumotlar to'plamlariga nisbatan qo'llash mumkin
emas. Natijalar kattaroq ma'lumotlar to'plamlari uchun yaxshiroq natija
beradi.
Logistik regressiya tushunchasi va ularning mashinali o'qitishda qo'llanilishi
Logistik regression (logistik regression) - ob'ektlarning sinflarga tegishli bo'lgan
havoriy (апостериорные) ehtimolligini baholashga imkon beruvchi
chiziqli tasnifni (классификатор) yaratish usuli. n-sonli belgilar bilan
tasvirlansin Unda ob'ektlarning xarakterli tavsiflari maydoni . Y —
sinflarning son-sanoqsiz sonlari (nomlari, teglari) bo'lsin.
"Ob'ekt, javob" juftligini o'qitish namunasi berilsin
Logistik regressiyasi maqsadli o'zgaruvchining ehtimolligini taxmin qilish
uchun ishlatiladigan nazorat ostida o'quv tasnifi algoritmidir. Maqsad yoki
qaram o'zgaruvchining tabiyati dixotomikdir, ya'ni faqat ikkita mumkin bo'lgan
sinf bo'ladi. Qisqacha aytganda, qaram o'zgarmaydigan ikkilik xususiyatga
ega va
(muvaffaqiyat / ha degan ma'noni anglatadi) yoki 0 (rad etish / yo'q degan
ma'noni anglatadi) sifatida kodlangan ma'lumotlarga ega.
Matematik tarzda, logistik regressiyasi modeli p (Y = 1) ni x funktsiyasi sifatida
bashorat qiladi, bu spamni aniqlash, diabetni prognoz qilish, saratonni aniqlash va
h. K. kabi turli xil tasniflash vazifalari uchun ishlatilishi mumkin bo'lgan eng oddiy
ML algoritmlaridan biridir.
Logistika regressiyasi – bu o'zgaruvchilar o'rtasidagi bog'liqlikni aniqlashning bir
usuli bo'lib, ulardan biri qat'iy qaram va boshqalar mustaqildir. Buning uchun
logistika funktsiyasi (qayta ishlaydigan logistika taqsimoti) qo'llaniladi.
Logistika regressiyasining amaliy ahamiyati shundaki, u bir
yoki bir nechta
mustaqil o'zgaruvchini o'z ichiga olgan voqealarni bashorat qilishning kuchli statist
ik usuli hisoblanadi. Bu quyidagi hollarda talab qilinadi:
Logistik regressiyasi turlari . Odatda, logistika regressiyasi ikkilik maqsadli
parametrlarga ega bo'lgan ikkilik logistika regressiyasini anglatadi, ammo
maqsadli o'zgaruvchilarning yana
ikkita toifasi tomonidan prognoz qilinishi mumkin.
Ushbu toifadagi toifalarga asoslanib, logistik regressiya
quyidagi turlarga bo'linishi mumkin
Ikkilik yoki binomial
Ushbu turdagi tasniflashda qaram o'zgaruvchining faqat ikkita turi mavjud: 1 va 0.
Misol uchun, bu o'zgaruvchilar muvaffaqiyat yoki muvaffaqiyatsizlikni, ha
yoki yo'q, g'alaba yoki yo'qotishni va boshqalarni ifodalaydi.
Polinomial
Ushbu tasniflash shaklida qaram o'zgarmaydigan 3 yoki undan ko'p sonli tartibsiz t
urlarga yoki miqdoriy ahamiyatga ega bo'lmagan turlarga ega bo'lishi
mumkin. Misol uchun, bu o'zgaruvchilar "a turi" yoki "b turi" yoki "C
turi"ni ifodalaydi.
Tartib
Ushbu tasniflash shaklida qaram o'zgarmaydigan 3 yoki undan ko'p buyurtma
turlari yoki miqdoriy ahamiyatga ega bo'lgan turlarga ega bo'lishi mumkin.
Misol uchun, bu o'zgaruvchilar "yomon" yoki "yaxshi", "juda yaxshi", "yaxshi" va
har bir toifadagi 0,1,2,3 kabi ballar bo'lishi mumkin.
Ikki tomonlama logistik regressiyasi modeli.
Logistika regressiyasining eng oddiy shakli ikkilik yoki binomial logistika
regressiyasi bo'lib, unda maqsadli yoki qaram o'zgaruvchining faqat 2 turi bo'li-
shi mumkin: 1 yoki 0.
Logistik regressiyasining yana bir foydali shakli-maqsad yoki qaram
o'zgaruvchining 3 yoki undan ko'p tartibsiz turlarga, ya'ni miqdoriy ahamiyatga
ega bo'lmagan turlarga ega bo'lishi mumkin bo'lgan polinomial logistik
regressiyasi.
Logistik regressiya bu o'zgaruvchilardan o'zaro bog'liqlikni aniqlash usulidir,
ulardan biri qat'iyan bog'liq, boshqalari esa mustaqil. Buning uchun logistik
funksiyadan (akkumulyativ logistik taqsimot) foydalaniladi. Logistik
regressiyaning amaliy qiymati shundaki, u bir
yoki bir nechta mustaqil
o'zgaruvchini o'z ichiga olgan voqealarni bashorat qilishning kuchli statistik usuli
hisoblanadi.
Dostları ilə paylaş: