Fimmtándi kafli: Aðhvarfsgreining
Einföld línuleg aðhvarfsgreining
Fjölbreytuaðhvarfsgreining
Aðhvarfsgreining hlutfalla
15
AÐHVARFSGREINING
-
Í þessum kafla er fjallað um hvernig aðhvarfsgreining (Regression analysis) er gerð í SPSS. Hafið forritið opið á meðan kaflinn er lesinn og gerið það sem tekið er fyrir. Í lok kaflans eru verkefni.
-
Aðhvarfsgreiningu er hægt að nota til þess að spá fyrir um útkomu ákveðins einstaklings á tiltekinni breytu ef útkoma hans á einhverri annarri breytu er þekkt.
-
Áður en aðhvarfgreining er gerð er góð regla að byrja á því að skoða dreifirit (scatterplot) sem lýsir sambandi breytanna. Þessi leið er farin í valrönd til að búa til dreifirit: Graphs Chart Builder.
-
Til að gera einfalda línulega aðhvarfsgreiningu í SPSS er þessi leið farin í valrönd: AnalyzeRegressionLinear.
-
Hægt er að búa til aðhvarfsjöfnu út frá gögnum í einfaldri aðhvarfsgreiningu. Form aðhvarfsjöfnu í einfaldri dreifigreiningu er eftirfarandi: y = a + bx + v.
-
Til að gera skipun um fjölbreytuaðhvarfsgreininguna í SPSS er eftirfarandi leið farin í valrönd:Analyze Regression Linear.
-
Hægt er að búa til aðhvarfsjöfnu út frá gögnum í fjölbreytuaðhvarfsgreiningu. Form aðhvarfsjöfnunnar þegar tvær frumbreytur eru notaðar er eftirfarandi: y = a + b1X1 + b2X2 + v.
-
Varast ber að líta svo á að niðurstöður úr aðhvarfsgreiningu segi til um orsakasamband milli breytanna í greiningunni. Að þessu leyti líkist aðhvarfsgreining fylgnirannsóknum.
Aðhvarfsgreiningu (regression analysis) er hægt að nota til þess að spá fyrir um útkomu ákveðins einstaklings á tiltekinni breytu ef útkoma hans á einhverri annarri breytu er þekkt. Við gætum til dæmis spáð fyrir um hvað ákveðinn einstaklingur er líklegur til þess að kjósa út frá fyrirliggjandi upplýsingum um þjóðfélagsstöðu hans, menntun eða tekjur. Jafnframt má nota niðurstöður úr aðhvarfsgreiningu til þess að meta hversu sterkt samband er á milli útkomu einstaklingsins á ákveðinni breytu eða breytum eftir gildum hans á tveimur eða fleiri breytum.
Aðhvarfsgreining er lík fylgnirannsóknum að því leyti að hún byggist á fylgni milli breyta. Eins og áður hefur komið fram (sjá 11. kafla) segir fylgni milli tveggja breyta ekkert um orsakasamhengi milli þeirra. Varast ber að líta svo á að niðurstöður úr aðhvarfsgreiningu, þar sem kemur fram að hægt er að spá fyrir um dreifingu á einni breytu út frá dreifingu á annarri, segi eitthvað um að önnur breytan valdi því hvernig gildin dreifast á hinni.
Einföld línuleg aðhvarfsgreining
Í töflu 15.1 eru gögn um orðaforða 40 barna á aldrinum eins til fimm ára (átta börn á hverju aldursbili).1 Með dreifigreiningu getum við reynt að leggja mat á hversu sterkt sambandið er á milli aldurs og orðaforða, og búið til aðhvarfsjöfnu sem gerir mögulegt að spá fyrir um stærð orðaforða tiltekins barns ef upplýsingar um aldur þess liggja fyrir. Hér á eftir verður þetta gert.
Tafla 15.1. Orðaforði barna eftir aldri.
|
Aldur í árum
|
Orðaforði
|
|
Aldur í árum
|
Orðaforði
|
1
|
3
|
|
3,5
|
1203
|
1,5
|
24
|
|
3
|
183
|
1,5
|
39
|
|
3
|
1117
|
1,5
|
7
|
|
3,5
|
915
|
1
|
10
|
|
4,5
|
1507
|
1,5
|
12
|
|
4
|
1786
|
1
|
17
|
|
4
|
1228
|
1
|
3
|
|
4,5
|
1330
|
2
|
240
|
|
4,5
|
1973
|
2
|
210
|
|
4
|
1540
|
2,5
|
239
|
|
4,5
|
1870
|
2,5
|
490
|
|
4
|
2072
|
2,5
|
370
|
|
5,5
|
2564
|
2
|
130
|
|
5
|
2534
|
2,5
|
376
|
|
5
|
2256
|
2
|
247
|
|
5,5
|
3010
|
3
|
912
|
|
5
|
2704
|
3,5
|
954
|
|
5,5
|
2590
|
3,5
|
431
|
|
5
|
1097
|
3
|
397
|
|
5,5
|
2578
|
Gögnin í töflu 15.1 eru sett upp í gagnasniði SPSS á sama hátt og sýnt er á mynd 15.1 (ein breyta fyrir aldur í árum og ein breyta fyrir orðaforða). Spurningin sem við viljum svara í aðhvarfsgreiningunni er hvort hægt sé að nota þessar upplýsingar til að spá fyrir um hversu mikinn orðaforða ákveðið barn hefur þegar við vitum aldur þess.
|
Mynd 15.1. Gögn í gagnasniði SPSS um orðaforða eftir aldri.
|
Í einfaldri aðhvarfsgreiningu er oft gott að byrja á því að skoða dreifirit (scatterplot) til þess að átta sig betur á því hvernig gögnin líta út. Hver einstaklingur er táknaður með punkti á dreifiritinu og gildi hans á breytunum tveimur (aldur, orðaforði) ræður staðsetningu punktsins á dreifiritinu. Þessi leið er farin í valrönd til að búa til dreifirit:
Graphs
Chart Builder
Í glugganum sem opnast er valið og Simple Scatter (sjá nánar í kafla 4.) Breytan aldur er sett á X-ás (X Axis) og orðaford á Y-ás (Y Axis), eins og sýnt er á mynd 15.2. Síðan er smellt á takkann OK. Þá á dreifiritið á mynd 15.3 að birtast í niðurstöðuskrá.
|
Mynd 15.2. Úrvinnslugluggi myndrita.
|
|
Mynd 15.3. Dreifirit í niðurstöðuskrá.
|
Á dreifiritinu (mynd 15.3) kemur fram að gera má ráð fyrir að eftir því sem börnin eru eldri aukist orðaforði þeirra. Eftir því sem aldurinn hækkar (á lárétta ásnum) hækkar orðaforðinn (á lóðrétta ásnum) einnig.
Með aðhvarfsgreiningu má í fyrsta lagi meta hversu sterkt samband þetta er, og í öðru lagi gefur aðhvarfsgreining okkur færi á að spá fyrir um orðaforða ákveðins barns með aðhvarfsjöfnu ef við þekkjum aldur þess. Til eru margar mismunandi tegundir aðhvarfsgreiningar, þar sem gert er ráð fyrir mismunandi tegundum sambands á milli frum- og fylgibreytu. Hér munum við einblína á línulega aðhvarfsgreiningu (linear regression) þar sem gert er ráð fyrir línulegu sambandi milli frum- og fylgibreytu.
Til að gera línulega aðhvarfsgreiningu í SPSS á gögnunum í tafla 15.1 er byrjað á því að fara þessa leið í valrönd:
Analyze
Regression
Linear
|
Mynd 15.4. Einföld línuleg aðhvarfsgreining skilgreind í úrvinnsluglugga í SPSS.
|
Þá birtist glugginn á mynd 15.4. Þar sem við erum að athuga áhrif aldurs á orðaforða setjum við ordaford inn sem fylgibreytu (Dependent) og aldur sem frumbreytu (Independent(s)) eins og gert hefur verið í glugganum á mynd 15.4.2 Með því að smella á takkann Statistics má síðan biðja um ýmsa lýsandi tölfræði. Smellt er á Continue í glugganum sem birtist og síðan á OK. Þá birtast meðal annars töflurnar á mynd 15.5 í niðurstöðuskrá.
Model Summary
|
Model
|
R
|
R Square
|
Adjusted R Square
|
Std. Error of the Estimate
|
1
|
,927a
|
,859
|
,855
|
365,211
|
a. Predictors: (Constant), Aldur
|
|
|
ANOVAb
|
Model
|
Sum of Squares
|
df
|
Mean Square
|
F
|
Sig.
|
1
|
Regression
|
30776379,648
|
1
|
30776379,648
|
230,744
|
,000a
|
Residual
|
5068398,752
|
38
|
133378,915
|
|
|
Total
|
35844778,400
|
39
|
|
|
|
a. Predictors: (Constant), Aldur
b. Dependent Variable: Orðaforði
|
Mynd 15.5. Niðurstaða aðhvarfsgreiningar í niðurstöðuskrá.
|
Það sem skiptir ef til vill mestu máli í efri töflunni á mynd 15.5 er R2 (R square) sem segir til um hversu stórt hlutfall af dreifingu orðafjölda má skýra með aldri. R2 er 0,859. Það þýðir að aldur skýrir tæp 86% af dreifingu orðaforða í þessum gögnum. Það er hátt hlutfall. Nauðsynleg forsenda þess að nota stuðla þá sem gefnir eru í greiningunni til þess að fá fram spágildi er að breytur í aðhvarfsgreiningunni skýri viðunandi hluta af dreifingu fylgibreytunnar. Með öðrum orðum að R2 gildið sé tiltölulega hátt.
Í neðri töflunni á mynd 15.5 (tafla með fyrirsögninni ANOVA) má sjá að F-gildið ér hátt og p-gildið < 0,001 og samspil aldurs og orðafroða er marktækt. Þó verður að hafa í huga að út frá þessum niðurstöðum er ekki unnt að álykta neitt um orsakasamband milli aldurs og orðaforða. Hér erum við í raun aðeins að tala um tölfræðilega fylgni milli breytanna þó unnt sé að nota hana í forspá.
Coefficientsa
|
Model
|
Unstandardized Coefficients
|
Standardized Coefficients
|
T
|
Sig.
|
B
|
Std. Error
|
Beta
|
1
|
(Constant)
|
-955,821
|
142,867
|
|
-6,690
|
,000
|
Aldur
|
610,776
|
40,208
|
,927
|
15,190
|
,000
|
a. Dependent Variable: Orðaforði
|
Mynd 15.6. Stuðlar sem eru notaðir í aðhvarfsjöfnu.
|
Í töflunni á mynd 15.6 (fyrirsögnin Coefficients) má sjá aðhvarfsstuðulinn fyrir breytuna aldur (610,77) sem og skurðpunktinn þegar aldursbreytan er 0 (-955,8). Báðir stuðlarnir eru marktækir með p-gildi < 0,001. Hægt er að búa til aðhvarfsjöfnu út frá þessum gögnum þar sem spáð er fyrir um orðaforða barns á tilteknum aldri. Aðhvarfsjöfnur í einfaldri dreifigreiningu eru á eftirfarandi formi:3
y = a + bx + v
Í jöfnunni hér fyrir ofan vísar y til þess gildis sem við viljum spá fyrir um (gildi á fylgibreytunni), a er skurðpunkturinn á Y ásnum (kallað Constant í töflunni á mynd 15.6), b er stuðullinn fyrir frumbreytuna (aldur í okkar tilfelli), x er gildi þess einstaklings sem við viljum spá fyrir um á aldursbreytunni, og v er óþekkt skekkja og er því ekki notuð við útreikning spágildis.
Ef við viljum spá fyrir um hver orðaforði fjögurra og hálfs árs barns er, væri það gert með því að setja upp eftirfarandi jöfnu:
Orðaforði fjögurra og hálfs árs barns = - 955,8 + (4,5 * 610,77)
Útkoman úr þessu er 2748,47. Þetta þýðir að aðhvarfslíkan okkar gerir ráð fyrir að fjögurra og hálfs árs barn hafi orðaforða upp á 2700 til 2800 orð. Hægt er að meta hversu vel líkanið spáir fyrir um gildin með því að meta skekkjumörk þau sem fylgja greiningunni ef beðið er um að þau séu birt. Það er gert með því að smella á takkann Statistics á mynd 15.4.
Ef við viljum spá fyrir um væntanlegan orðaforða tveggja ára barns lítur jafnan svona út:
Orðaforði tveggja ára barns = - 955,8 + (2 * 610,77)
Útkoman úr þessu er 265,8, og samkvæmt líkaninu getum við því búist við að tveggja ára barn hafi orðaforða sem er á bilinu 260 til 270 orð.
Það er rétt að geta þess að þetta líkan hefur einn augljósan galla. Ef aldurinn 0,5 er t.d. settur inn í jöfnuna, þá fáum við út að orðaforði hálfs árs gamals barns sé minni en enginn (-650,4) sem er augljóslega út í hött. Tvennt ber að nefna í þessu sambandi. Í fyrsta lagi að það er oft varhugavert að nota aðhvarfslíkan til þess að spá fyrir um gildi sem eru ekki mæld í upphaflegu mælingunum (lægsta aldursbilið í gögnunum var 1) en hérna erum við að reyna að spá fyrir um orðaforða hálfs árs gamals barns, en það voru engin börn á þessum aldri í úrtakinu. Í öðru lagi ber að geta þess að í okkar tilfelli notuðum við línulega aðhvarfsgreiningu þar sem reynt er að meta línulegt samband á milli breytanna, en það má vera að annars konar samband lýsi tengslum þessara breyta betur, til dæmis einhvers konar sveiglínulíkan þar sem áhrifin eftir aldri lúta ekki einföldu samlagningarlögmáli heldur lúti þau til dæmis jákvæðu veldislögmáli.
Dostları ilə paylaş: |