1.4. Taxminan xato. Absolyut yaqinlashish xatosidan foydalanib, regressiya tenglamasining sifatini baholaylik. O'rtacha taxminiy xato - hisoblangan qiymatlarning haqiqiy qiymatlardan o'rtacha og'ishi:
5% -7% gacha bo'lgan taxminiy xato regressiya tenglamasining dastlabki ma'lumotlarga mosligini ko'rsatadi..
A ==
3.51%
O'rtacha hisoblangan qiymatlar haqiqiy qiymatlardan 3,51% ga og'adi. Xato 7% dan kam bo'lganligi sababli, bu tenglama regressiya sifatida ishlatilishi mumkin.
1.6. Aniqlash koeffitsienti. (Ko'p) korrelyatsiya koeffitsientining kvadrati determinatsiya koeffitsienti deb ataladi, bu omil atributining o'zgarishi bilan izohlanadigan natijaviy atributdagi o'zgarishlarning nisbatini ko'rsatadi.
Ko'pincha, determinatsiya koeffitsientini sharhlashda u foiz sifatida ifodalanadi.
R2= 0,9662 = 0,9328
bular. 93,28% hollarda x ning o'zgarishi y ning o'zgarishiga olib keladi. Boshqacha qilib aytganda, regressiya tenglamasini tanlashning aniqligi yuqori. Y dagi o'zgarishning qolgan 6,72% modelda hisobga olinmagan omillar (shuningdek, spetsifikatsiya xatolari) bilan izohlanadi.
Regressiya parametrlarining sifatini baholash uchun biz hisoblash jadvalini tuzamiz (2-jadval)
x
y
y(x)
(yi-ycp)2
(y-y(x))2
|y - yx|:y
14459.8
26290.6
28378.305
75788196.828
4358510.793
0.0794
15658
27861.1
29396.425
50910246.603
2357222.42
0.0551
14981
29145.9
28821.173
34226497.617
105447.944
0.0111
15791.8
30723.3
29510.116
18258030.487
1471815.914
0.0395
16877
32770.8
30432.219
4952590.612
5468961.222
0.0714
21407
34921.7
34281.396
5556.46
409988.643
0.0183
23931.2
36873.9
36426.23
3525600.817
200408.869
0.0121
28102.2
38182.4
39970.362
10151604.925
3196807.362
0.0468
28322
38957.4
40157.128
15690775.342
1439346.361
0.0308
28076.5
39656.1
39948.524
21714279.687
85511.967
0.00737
29127.9
40738.4
40841.907
32972382.325
10713.769
0.00254
30245
43833.3
41791.116
78093599.987
4170514.664
0.0466
266979.4
419954.9
419954.9
346289361.689
23275249.929
0.421
2. Regressiya tenglamasi parametrlarini baholash. 2.3. Regressiya koeffitsientlarini baholashning aniqligini tahlil qilish. Buzilishlarning tarqalishining xolis bahosi - bu miqdor:
S2 = 2327524,993 - tushuntirilmagan dispersiya yoki regressiya xatosi dispersiyasi (qaram o'zgaruvchining regressiya chizig'i atrofida tarqalishining o'lchovi).
S = 1525.62 - baholashning standart xatosi.
Regressiyaning standart xatosi kuzatilgan ma'lumotlarning modellashtirilgan qiymatlardan tarqalishining o'lchovi sifatida qaraladi. Regressiya standart xatosi qanchalik past bo'lsa, modelning sifati shunchalik yuqori bo'ladi.
Sa - tasodifiy o'zgaruvchining standart og'ishi a.
Sb - tasodifiy o'zgaruvchining standart og'ishi b.
2.5. Chiziqli regressiya tenglamasining koeffitsientlariga oid gipotezalarni tekshirish. 1) biz faqat ma'lum bir statistik kuzatishga xos bo'lgan regressiya tenglamasi parametrlarining taxminlarini oldik (x va y qiymatlarining ma'lum bir to'plami).
Regressiya va korrelyatsiya koeffitsientlarining statistik ahamiyatini baholash uchun har bir ko'rsatkich uchun Student t-testi va ishonch intervallari hisoblab chiqiladi. H0 gipotezasi ko'rsatkichlarning tasodifiy tabiati haqida ilgari suriladi, ya'ni. noldan ularning ahamiyatsiz farqi haqida.
Parametrlarning ahamiyatli yoki yo'qligini tekshirish uchun, ya'ni. aholi gipotezalarni tekshirish uchun statistik usullardan foydalanish uchun noldan sezilarli farq qiladimi.
Asosiy (nul) gipoteza - bu populyatsiyadagi parametr yoki statistik xarakteristikaning noldan ahamiyatsiz farqi haqidagi gipoteza. Asosiy (sinovdan o'tgan) gipoteza bilan bir qatorda populyatsiyadagi parametr yoki statistik xarakteristikaning nolga tengligi to'g'risida muqobil (raqobatchi) gipoteza ilgari suriladi.
Ayrim regressiya koeffitsientlarining nolga tengligi haqidagi H0 gipotezasini (agar muqobil H1 ga teng bo'lmasa) a=0,05 ahamiyatlilik darajasida tekshiramiz.
H0: b = 0, ya'ni populyatsiyada x va y o'zgaruvchilar o'rtasida chiziqli bog'liqlik yo'q;
H1: b ≠ 0, ya'ni populyatsiyadagi x va y o'zgaruvchilari o'rtasida chiziqli bog'liqlik mavjud.
Agar asosiy gipoteza noto'g'ri bo'lib chiqsa, biz muqobilni qabul qilamiz. Bu gipotezani tekshirish uchun Student t-testidan foydalaniladi.
Kuzatish ma'lumotlaridan topilgan t-kriteriyasi qiymati (kuzatilgan yoki haqiqiy deb ham ataladi) Talabalar taqsimoti jadvallaridan (odatda statistika yoki ekonometriya bo'yicha darsliklar va seminarlar oxirida berilgan) aniqlangan jadvallashtirilgan (tanqidiy) qiymat bilan taqqoslanadi.
Jadval qiymati muhimlik darajasiga (a) va erkinlik darajalari soniga qarab aniqlanadi, bu chiziqli juft regressiya holatida (n-2) ga teng, n - kuzatishlar soni.
Agar t-testning haqiqiy qiymati jadvaldagi qiymatdan (modul) katta bo'lsa, u holda asosiy gipoteza rad etiladi va ehtimollik (1-a) bilan populyatsiyadagi parametr yoki statistik xarakteristika noldan sezilarli darajada farq qiladi deb hisoblanadi. .
Agar t-testning haqiqiy qiymati jadval qiymatidan (modul) kamroq bo'lsa, unda asosiy gipotezani rad qilish uchun hech qanday sabab yo'q, ya'ni. populyatsiyadagi parametr yoki statistik xarakteristika a ahamiyatlilik darajasida noldan sezilarli darajada farq qilmaydi.
tcrit(n-m-1;a/2) = tcrit(10;0,025) = 2,634
11,78 > 2,634 dan boshlab regressiya koeffitsienti b ning statistik ahamiyati tasdiqlanadi (biz bu koeffitsient nolga teng degan gipotezani rad qilamiz).
9,67 > 2,634 bo'lganligi sababli a regressiya koeffitsientining statistik ahamiyati tasdiqlanadi (biz bu koeffitsient nolga teng degan gipotezani rad qilamiz).