CHIZIQSIZ REGRESSIYA
REJA:
1. Polinomli regressiya
2. Nochiziqli regressiya
3. Ma'lumotlarni tekislash
4. Tobelikni bashorat qilish
Nochiziqli regressiya - qaram o'zgaruvchi va mustaqil o'zgaruvchilar to'plami o'rtasidagi munosabatlarning chiziqli bo'lmagan modelini topish usuli.
Chiziqli modellarni baholash bilan cheklangan an'anaviy chiziqli regressiyadan farqli o'laroq, chiziqli bo'lmagan regressiya mustaqil va qaram o'zgaruvchilar o'rtasidagi o'zboshimchalik bilan bog'liq bo'lgan modellarni baholashi mumkin. Odatda statistik xarakterga ega bo'lgan yoki shovqin darajasi yuqori bo'lgan jarayonlar yoki fizik hodisalarni o'lchash natijasida olingan eksperimental ma'lumotlarni qayta ishlashda paydo bo'ladi. Regressiya tahlilining vazifasi eksperimental ma'lumotlarni eng yaxshi tavsiflovchi matematik formulalarni tanlashdir.
Regressiya masalasining matematik formulasi quyidagicha. Tasodifiy jarayon yoki fizik hodisa Y ning ma'lum bir xususiyati qiymatining (raqamli qiymati) umumiy holatda tasodifiy o'zgaruvchiga ham tegishli bo'lishi mumkin bo'lgan boshqa o'zgaruvchan xususiyatga yoki X parametriga bog'liqligi xk nuqtalar to'plamida qayd etiladi. yk qiymatlar to'plami bo'yicha, har bir nuqtada ro'yxatdan o'tgan yk va xk qiymatlari Y(xk) ning haqiqiy qiymatlarini, qoida tariqasida, oddiy qonunga muvofiq taqsimlangan tasodifiy xato ?k bilan ifodalaydi. Yk qiymatlari yig’indisidan kelib chiqib, Y(x) bog’liqligini minimal xato bilan aks ettiradigan f(xk, a0, a1, …, an) funksiyani tanlash talab qilinadi. Bu taxminiy shartni anglatadi:
yk = f(xk, a0, a1, …, an) + ?k.
f(xk, a0, a1, …, an) funksiya y qiymatining x qiymatiga regressiyasi deyiladi. Regressiya tahlili funksiya turini belgilashni o'z ichiga oladi
f(xk, a0, a1, …, an) va uning a0, a1, …, an parametrlarining raqamli qiymatlarini aniqlash, yk qiymatlari toʻplamiga yaqinlashishning eng kichik xatosini taʼminlaydi. Qoida tariqasida, regressiya tahlilida yaqinlashish xatosi eng kichik kvadratlar usuli (LSM) bilan hisoblanadi. Buning uchun kvadrat qoldiq xatolar funktsiyasi minimallashtiriladi:
a0, a1, …, an) = [f(xk, a0, a1, …, an) - yk] 2.
a0, a1, …, an parametrlarini aniqlash uchun qoldiq xato funksiyasi barcha parametrlarga nisbatan differensiallanadi, olingan qisman differensial tenglamalar nolga tenglashtiriladi va barcha parametr qiymatlariga nisbatan birgalikda yechiladi. Regressiya turlari odatda yaqinlashuvchi funktsiyalar turiga ko'ra nomlanadi: polinom, eksponensial, logarifmik.
Men tanlagan mavzuning dolzarbligi iqtisodiy jarayonlarni o‘rganishda nochiziqli modellardan ko‘proq foydalanilayotganligi bilan bog‘liq. Ushbu model ishlab chiqarishning asosiy omillari va mahsulot hajmi o'rtasidagi bog'liqlik kabi chiziqli bo'lmagan ishlab chiqarish funktsiyalarini aniqlashga yordam beradi. Shuningdek, chiziqli bo'lmagan model tovarlarga talab va ularning narxlari o'rtasidagi bog'liqlikni aniqlashga yordam beradi.
Referatning maqsadi: chiziqli bo'lmagan regressiyaning mohiyati va xususiyatlarini ochib berish.
1. Chiziqli regressiya
Umumiy tamoyil. Ixtiyoriy ma'lumotlar skning LSM yaqinlashuvining eng oddiy usuli birinchi darajali polinom yordamida, ya'ni. y(t) = a+bt ko’rinishdagi funksiyalar. tk nuqtalari bo'yicha ma'lumotlarning diskretligini hisobga olgan holda, qoldiq xatolar funktsiyasi uchun bizda:
(a,b) = [(a+b tk) - sk] 2.
Biz a, b argumentlariga nisbatan qoldiq xatolar funksiyasini ajratamiz, natijada olingan tenglamalarni nolga tenglashtiramiz va tizimning 2 ta normal tenglamasini hosil qilamiz:
(a + b tk) - sk a1 + btk -sk = 0,
((a+b tk) - sk) tk atk + btk2 - sk tk = 0,
K-o'qishlar uchun bu tenglamalar tizimining aniq ko'rinishida yechimi:
b = [Ktk sk -tksk] / [Ktk2 - (tk) 2],
a = [ sk - btk ] / K.
Koeffitsientlarning olingan qiymatlari y(t) = a+bt regressiya tenglamasida qo'llaniladi. Boshqa har qanday regressiya turlarining koeffitsientlari shunga o'xshash texnikadan foydalangan holda hisoblab chiqiladi, ular faqat mos keladigan ifodalarning noqulayligi bilan farqlanadi.
Mathcad da amalga oshirish. Mathcad tizimida chiziqli regressiya X argument vektorlari va Y namunalari funksiyalar orqali amalga oshiriladi:
intercept(X,Y) - a parametrini, regressiya chizig'ining vertikal siljishini hisoblaydi;
regressiya chizig'ining qiyaligini hisoblab chiqadi .
X argumenti bo'yicha o'qishlarning joylashuvi ixtiyoriydir. corr(X,Y) funksiyasi qo'shimcha ravishda Pearson korrelyatsiya koeffitsientini hisoblashi mumkin. 1 ga qanchalik yaqin bo'lsa, qayta ishlangan ma'lumotlar chiziqli munosabatlarga qanchalik to'g'ri keladi.
Chiziqli regressiyaga misol 1.1-rasmda keltirilgan
1.1-rasm Chiziqli regressiya.
2. Polinomli regressiya
Ko'phadning ixtiyoriy darajasi n bo'lgan va Mathcad da ixtiyoriy tanlanma koordinatalari bo'lgan bir o'lchovli polinom regressiyasi quyidagi funktsiyalar orqali amalga oshiriladi:
regress(X,Y,n) - n-darajali ko'phadning ki koeffitsientlarini o'z ichiga olgan interp(...) funksiya uchun S vektorini hisoblaydi;
interp(S,X,Y,x) - x koordinatalaridagi yaqinlashish funksiyasining qiymatlarini qaytaradi.
Interp(…) funktsiyasi quyidagi formula bo'yicha hisob-kitoblarni amalga oshiradi:
f(x) = k0 + k1 x1 + k2 x2 + … + kn xn ? ki xi.
Ki koeffitsientlarining qiymatlari S vektoridan submatritsa (S, 3, uzunlik (S), 0, 0) funksiyasi yordamida chiqarilishi mumkin.
2.1-rasmda 2, 3 va 8-darajali ko'phadlar yordamida ko'phadli regressiya misoli keltirilgan. Polinom darajasi odatda 4-6 dan ko'p bo'lmagan darajani ketma-ket oshirish bilan o'rnatiladi, bu taxminiy funktsiyaning haqiqiy ma'lumotlardan standart og'ishini nazorat qiladi.
Ko'rish osonki, polinom darajasi oshgani sayin, yaqinlashish funktsiyasi haqiqiy ma'lumotlarga yaqinlashadi va polinom darajasi ma'lumotlar namunalari soniga minus 1 ga teng bo'lganda, u odatda ma'lumotlar interpolyatsiyasi funktsiyalariga aylanadi, bu regressiya muammolariga mos kelmaydi.
Shakl.2.1 Bir o'zgaruvchan ko'p nomli regressiya.
Zonal regressiya. Butun nuqtalar to'plami bo'yicha regress funktsiyasi bitta yaqinlashuvchi polinomni yaratadi. Ko'p sonli namunalar va ma'lumotlar o'zgarishining ancha murakkab dinamikasi bo'lgan katta koordinatali intervallar uchun kichik darajali polinomlar segmentlari bo'yicha ketma-ket mahalliy regressiyadan foydalanish tavsiya etiladi. Mathcadda bu interp(S,X,Y,x) funksiyasi uchun maxsus S vektorini tashkil etuvchi loess(X, Y, span) funksiyasi orqali ikkinchi darajali ko‘phadlar segmentlari orqali amalga oshiriladi. Ushbu funktsiyadagi oraliq> 0 argumenti (0,1-2 tartibida) mahalliy hududning o'lchamini aniqlaydi va ma'lumotlarning tabiati va kerakli tekislash darajasini hisobga olgan holda tanlanadi (oraliq qanchalik katta bo'lsa, shunchalik katta bo'ladi). ma'lumotlarni tekislash darajasi) .
Guruch. 2.2 Ikkinchi darajali ko'phad bilan zonal regressiya.
2.2-rasmda model egri chizig'ining (sinusoid segmenti) jami shovqin bilan regressiyasini hisoblash misoli keltirilgan. Hisob-kitoblar oraliqning ikkita qiymati uchun asosiy egri chiziqqa yaqinlashishini aniqlash bilan amalga oshiriladi. Har qanday tasodifiy jarayonlar va signallarni yuqori shovqin darajasida modellashda, span parametrining optimal qiymati ildiz-o'rtacha kvadrat yaqinlashuvining minimal qiymati bilan aniqlanishi mumkin.
3. Nochiziqli regressiya
Ixtiyoriy funktsiyalarning chiziqli yig'indisi. Mathcad fn(x) funktsiyalarining vaznli yig'indisi ko'rinishidagi umumiy funktsiyaga yaqinlashadigan regressiyani amalga oshirish qobiliyatiga ega:
f(x, Kn) = K1 f1(x) + K2 f2(x) + … + KN fN(x),
fn(x) funktsiyalarining o'zi har qanday turdagi, shu jumladan chiziqli bo'lmagan bo'lishi mumkin. Bir tomondan, bu regressiya funktsiyalarini analitik ko'rsatish imkoniyatlarini keskin oshiradi. Ammo, boshqa tomondan, bu foydalanuvchidan juda oddiy funktsiyalar kombinatsiyasi orqali eksperimental ma'lumotlarni yaqinlashtirish bo'yicha ma'lum ko'nikmalarga ega bo'lishni talab qiladi.
X, Y va f vektorlari bo'yicha umumlashtirilgan regressiya Kn koeffitsientlarining qiymatlarini hisoblaydigan linfit (X, Y, f) funktsiyasi tomonidan amalga oshiriladi. f vektor fn(x) funksiyalarining ramziy ko'rinishini o'z ichiga olishi kerak. X vektoridagi xk koordinatalari har qanday bo'lishi mumkin, lekin x qiymatlarining o'sish tartibida (Y vektoridagi yk qiymatlarining mos keladigan o'qishlari bilan) joylashtirilgan. Regressiyaga misol 3.1-rasmda ko'rsatilgan / f1-f3 funktsiyalarining raqamli parametrlari minimal standart og'ish bo'yicha tanlangan.
3.1-rasm Umumlashtirilgan regressiya.
Umumiy turdagi regressiya. Chiziqli bo'lmagan regressiyaning ikkinchi turi genfit(X,Y,S,F) funksiyasi yordamida ki parametrlarini berilgan yaqinlashish funksiyasiga moslashtirish yo'li bilan amalga oshiriladi, bu esa ning minimal ildiz o'rtacha kvadrat xatosini ta'minlovchi ki koeffitsientlarini qaytaradi. regressiya funktsiyasining kirish ma'lumotlariga yaqinlashishi (koordinatalar va namunalarning X va Y vektorlari). Regressiya funksiyasining ramziy ifodasi va uning hosilalarining ki parametrlariga nisbatan ramziy ifodasi F vektorida yoziladi. S vektori nochiziqli tenglamalar tizimini iterativ usulda yechish uchun ki koeffitsientlarining boshlang'ich qiymatlarini o'z ichiga oladi. usuli. Usulni qo'llash misoli 3.2-rasmda ko'rsatilgan.
3.2-rasm Nochiziqli regressiyalar.
Oddiy standart taxminiy formulalar uchun bir qator regressiya funksiyalari taqdim etiladi, ularda funksiyalar parametrlari Mathcad dasturi tomonidan mustaqil ravishda tanlanadi.
Bularga quyidagi xususiyatlar kiradi:
expfit(X,Y,S) - y(x) = a exp(b x) + c ko'rsatkichli funksiyaning a, b va c koeffitsientlarini o'z ichiga olgan vektorni qaytaradi. Birinchi yaqinlashishning a, b va c koeffitsientlarining boshlang'ich qiymatlari S vektoriga kiritiladi. Taxminlovchi funktsiyalar shaklida yo'naltirish va koeffitsientlarning mos keladigan boshlang'ich qiymatlarini o'rnatish uchun chapdagi raqamlar a va c koeffitsientlarining doimiy qiymatlarida funktsiyalar shaklini ko'rsatadi.
lgsfit(X,Y,S) - y(x) = a/(1+c exp(b x)) ifodasi uchun ham xuddi shunday.
pwrfit(X,Y,S) - y(x) = a xb+c ifodasi uchun ham xuddi shunday.
sinfit(X,Y,S) - y(x) = a sin(x+b) + c ifodasi uchun ham xuddi shunday. Koeffitsientlarni sinusoidal regressiya funksiyasiga moslashtiradi. Sinusoid naqsh yaxshi ma'lum.
logfit(X,Y) - y(x) =a ln(x+b) +c ifodasi uchun ham xuddi shunday. Dastlabki yaqinlashishni o'rnatish shart emas.
medfit(X,Y) - y(x) = a + b x ifodasi uchun bir xil, ya'ni. chiziqli regressiya funktsiyasi uchun. Dastlabki yaqinlashishni o'rnatish ham talab qilinmaydi. Grafik to'g'ri chiziqdir.
3.3-rasmda ikkinchi darajali polinom tomonidan zonal regressiya bilan solishtirganda baza sinusoidida model ma'lumotlar massivining sinusoidal regressiyasini amalga oshirish misoli ko'rsatilgan. Bazis egri chizig'iga va dastlabki ma'lumotlarga rms yaqinlashtirish usullarini taqqoslashdan ko'rinib turibdiki, regressiya funktsiyasi uchun asos sifatida foydalanish statistik ma'lumotlar uchun kutish funktsiyasini bilish umuman regressiya parametrlarini aniqlash imkonini beradi. butun ma'lumotlar to'plami bo'yicha yuqori aniqlik bilan, garchi bir vaqtning o'zida regressiya egri chizig'i ushbu amalga oshirishning haqiqiy o'qishlarining mahalliy xususiyatlarini aks ettirmaydi. Bu regressiya funktsiyalari spetsifikatsiyasi bilan boshqa barcha usullar uchun ham amal qiladi.
Fig.3.3 Sinusoidal regressiya.
4. Ma'lumotlarni tekislash
Shovqin bilan buzilgan va statistik xarakterga ega bo'lgan silliqlash ma'lumotlar, shuningdek, uning funktsiyasining ramziy shaklini aniqlamasdan, regressiyaning alohida holati sifatida qaralishi mumkin va shuning uchun oddiyroq usullar bilan amalga oshirilishi mumkin. Mathcad tekislash uchun quyidagi funktsiyalardan foydalanadi:
supsmooth(X,Y) - k-eng yaqin namunalar ustida tekislash chiziqli eng kichik kvadratlardan foydalangan holda tekislangan Y ma'lumotlar vektorini qaytaradi, ma'lumotlar o'zgarishi dinamikasini hisobga olgan holda k qiymatini moslashtirilgan tarzda tanlaydi. X vektorining qiymatlari o'sish tartibida borishi kerak.
ksmooth(X,Y,b) - Gauss taqsimoti asosida tekislangan ma'lumotlar vektorini hisoblaydi. b parametri tekislash oynasining kengligini belgilaydi va x o'qi bo'ylab namunalar orasidagi intervaldan bir necha marta kattaroq bo'lishi kerak.
medsmooth(Y,b) - oyna kengligi b bo'lgan harakatlanuvchi median usuli yordamida tekislangan ma'lumotlar vektorini hisoblaydi, bu toq son bo'lishi kerak. matematik regressiya polinomi
Silliqlash usullarini taqqoslash 4.1-rasmda ko'rsatilgan . Ushbu rasmda ko'rib turganingizdek, supsmooth(X,Y) va ksmooth(X,Y,b) funksiyalari bo'yicha tekislash sifati deyarli bir xil (b parametrini mos tanlash bilan). Median usul o'z imkoniyatlari bo'yicha qolgan ikkitasidan past. Bundan tashqari, ma'lumotlar oralig'ining so'nggi nuqtalarida, ayniqsa, b/2 uzunlikdagi so'nggi oraliqlarda o'z funktsiyalarini umuman bajara olmaydigan median usulda tekislash sifati yomonlashishini ko'rish mumkin.
Fig.4.1 Ma'lumotlarni tekislash.
5. Tobelikni bashorat qilish
Mathcad prognozlash (Y, n, K) funksiyasi, bu erda n - bir xil taqsimlangan Y ma'lumotlar vektorining yaqinlashuvi polinomi darajasi, sizga ma'lumotlarning harakatini bashorat qilish (ekstrapolyatsiya) uchun nuqtalarning K vektorini hisoblash imkonini beradi. o'z spetsifikatsiyasidan tashqari ixtiyoriy signal (ko'tarilgan x koordinatalarida). Bashorat qanchalik aniq bo'lsa, berilgan signalning shakli shunchalik silliq bo'ladi. Funktsiyadan foydalanish misoli 5-rasmda silliq va statistik shovqinli signal egri chizig'i uchun ko'rsatilgan. Taxminlovchi polinom darajasi kirish ma'lumotlaridan foydalanish chuqurligini aniqlaydi va silliq va monoton signallar uchun juda kichik bo'lishi mumkin. Prognozlash xatosi berilgan ma'lumotlardan masofa oshgani sayin ortadi.
Fig.5 1. Bog'liqlikni bashorat qilish.
adabiyotlar ro'yxati
1. Dyakonov V.P. To'lqinlar. Nazariyadan amaliyotga. - M.: SOLON-R, 2002. - 448.
2. Korn G., Korn E. Olimlar va muhandislar uchun matematika bo'yicha qo'llanma. - M.: Nauka, 1984 yil.
3. Ekonometrika Ed.I. I. Eliseeva 2002 yil
4. A. A. Tsyplakov, "Ba'zi ekonometrik usullar. Ekonometrikada maksimal ehtimollik usuli", EF NSU, 1997 y.
5. Suslov V.I., Ibragimov N.M., Talysheva L.P., Tsyplakov A.A. Ekonometrika. - Novosibirsk: Rossiya Fanlar akademiyasining Sibir bo'limi nashriyoti, 2005. - 744 p.
6. V.P. Nosko "Ekonometrika" (Vaqt seriyasining regressiya tahliliga kirish) Moskva 2002 yil.
7. “Vaqt qatorlari tahlili” ma’ruzalari G.G. Kantorovich (Oliy Iqtisodiyot maktabi, SU-HSE) "Oliy Iqtisodiyot maktabi iqtisodiy jurnali" Vol.6 (2002), No 1,2,3,4 va Vol.7 (2003), No. 1.
Allbest.ru saytida joylashgan
Dostları ilə paylaş: |