La regressione lineare è usata per esplorare le relazioni fra eventi, per predire il comportamento di una variabile una volta che ne sono note altre, per individuare modelli e confrontarli veri'candone la bontà o comparando i set di variabili che li de'niscono.
Presentiamo tre casi di utilizzo della regressione lineare multivariata in tre diversi studi relativi a: l’uso dei serious games con i ragazzi delle scuole secondarie di primo grado, la de'nizione dei livelli di cittadinanza digitale degli insegnanti, il successo accademico di studenti universitari in un insegnamento erogato in modalità blended. Solo per un caso i tre articoli si riferiscono al settore del digitale, come è ovvio qualunque tema per il quale siamo in grado di de'nire variabili e raccogliere dati può essere analizzato attraverso questa metodologia.
Nina Iten e Dominik Petko, nell’articolo “Learning with serious games: Is fun playing the game a predictor of learning success?” (2016), pongono l’attenzione sul ruolo del fun nei serious games a partire dalla considerazione che tanto è stato detto sul ruolo del gioco nell’apprendimento e studi empirici che chiariscano la relazione fra fun e learning nella speci'ca applicazione dei serious games sono necessari.
Gli autori de'niscono 4 ipotesi da veri'care applicando la regressione multivariata che possiamo esprimere in maniera sempli'cata come segue:
più i bambini si divertono, più saranno disposti a usare i learning games (divertimento e volontà di usare i giochi);
più i bambini si divertono, più aumenterà il livello di motivazione a impegnarsi negli argomenti di studio del gioco (esperienza di divertimento e autovalutazione della motivazione di apprendere e impegnarsi negli argomenti di studio del gioco);
più i bambini si divertono, più avranno la percezione di aver acquisito maggiori conoscenze sui temi del gioco (divertimento e autovalutazione dei risultati di apprendimento);
più i bambini si divertono, più acquisiranno effettivamente conoscenze sui temi di studio (esperienza di divertimento e conoscenze acquisite sugli argomenti del gioco).
Lo studio esplorativo ha coinvolto 74 ragazzi di età compresa fra i 10 e i 13 anni scelti in maniera casuale in 5 classi in una scuola di primo ciclo in Svizzera. Gli studenti hanno usato in tre lezioni un gioco web-based, AWWWARE, il cui scopo è quello di promuovere la media competency fra i bambini, sviluppando le loro abilità critiche nella navigazione fra le pagine di internet. Insieme ai dati anagra'ci degli studenti partecipanti all’indagine, sono stati raccolti dati attraverso alcuni test composti da item con risposte su scala Likert a 5 livelli da:
pre-test e post-test che indagavano le opinioni dei ragazzi su utilità del gioco, semplicità, livelli di divertimento, desiderabilità sociale, abilità personali nell’uso del gioco, paura di usare il gioco e sbagliare, intenzione di usarlo in futuro;
test sul tema dell’information literacy in cui ai bambini è stato chiesto di valutare la qualità di 9 pagine internet;
test di autovalutazione del guadagno di apprendimento in termini di motivazione e conoscenze;
test di valutazione del gioco AWWWARE in termini di chiarezza di obiettivi, approcci strategici, uso delle conoscenze pregresse su Internet, Ousso di gioco, assistenza.
Per veri'care le ipotesi, gli autori hanno proposto 4 modelli di regressione lineare variando di volta in volta le variabili considerate.
Nel dettaglio:
H1: variabile dipendente = intenzione d’uso; predittori = variabili rilevate nel pre-test sulle opinioni dei bambini
H2: variabile dipendente = autovalutazione del guadagno di apprendimento in termini di motivazione; predittori = variabili rilevate nella valutazione del gioco
H3: variabile dipendente = autovalutazione del guadagno di apprendimento in termini di conoscenze; predittori = variabili rilevate nella valutazione del gioco
H4: variabile dipendente = punteggi nelle prove di valutazione; predittori
= variabili rilevate nella valutazione del gioco
Per ciascun modello gli autori riportano i valori su bontà e signi'catività e le tabelle riassuntive sui valori, lo standard error e la signi'catività dei coef'cienti di regressione parziale e dell’intercetta.
I primi tre modelli sono signi'cativi e presentano un R2 rispettivamente di 0,56, 0,63, 0,74. L’ultimo dei 4 modelli non è signi'cativo, spiega solo il 20% dei casi [R2 = 0,20; n=74, F (9,64) = 1,80, n.s.].
Leggendo i valori dei coef'cienti e la loro signi'catività, nell’articolo si giunge alla conclusione che soltanto la seconda ipotesi può essere accettata. Ad incidere sulle motivazioni d’uso dei serious games risultano piuttosto variabili come le aspettative relative all’utilità e alla semplicità, le conoscenze pregresse sui temi, i feedback.
Al centro del secondo studio che descriviamo è il tema della digital citizenship degli insegnanti analizzata nella percezione di sé stessi degli stessi docenti e motivata dalle azioni didattiche che contengono fenomeni di cyberbullismo e spingono gli studenti a coinvolgersi nella vita politica. Lo studio di Moonsun Choi, Dean Cristol e Belinda Gimbert (2018) indaga il modo in cui le caratteristiche personali e psicologiche e l’uso di internet possono inOuenzare i livelli di digital citizenship dei docenti. Il campione nell’analisi è composto da 348 insegnanti in formazione in un corso blended 'nalizzato a formare docenti da integrare in distretti scolastici “dif'cili”.
Come strumenti per la raccolta dei dati gli autori utilizzano la Digital Citizenship Scale (DCS) da loro precedentemente formulata e validata. Si tratta di una scala di autovalutazione composta da 26 item con risposte in una scala Likert a 7 livelli riferita a 5 ambiti: Technical Skills, Local/Global Awareness, Networking Agency, Internet Political Activism e Critical Perspective.
I docenti hanno risposto, inoltre, a domande su dati generali ed esperienze lavorative, sull’uso di internet a livello personale e nelle attività scolastiche e in'ne su self-efcacy e ansia nell’uso di internet attraverso l’uso di due scale riprese da altri studi (Internet self-efcacy scale e State-Trait Anxiety Inventory). Questo gruppo di dati ha costituito il set di variabili indipendenti che sono state gradualmente aggiunte nei tre modelli di regressione lineare attraverso i quali gli autori conducono l’analisi sulla relazione fra digital citizenship e caratteristiche dei docenti.
Nel primo modello sono usate come variabili indipendenti soltanto quelle relative ai dati anagra'ci e alle esperienze professionali; nel secondo sono aggiunte quelle relative all’uso di internet; il terzo comprende anche i risultati dei test su self-ef'cacy e livelli d’ansia. In ciascun modello troviamo 5 regressioni: per ciascuna la variabile dipendente è rappresentata da una delle cinque dimensioni valutate dalla DCS.
Confrontare modelli costruiti con variabili indipendenti diverse è una modalità frequente nell’uso della regressione lineare. I modelli gerarchici, come in questo caso, prevedono una introduzione graduale di gruppi di variabili per valutare le differenze nella bontà e signi'catività dei modelli composti da diversi set di variabili. In questi casi la costruzione dei modelli non ha tanto rilevanza in termini di predizione, quanto di confronto fra soluzioni diverse per trovare quella che meglio riesce a fornire valori più completi e signi'cativi delle relazioni individuate. L’indicatore usato in questo caso per confrontare fra di loro i modelli è R2 che assume valori più alti per tutte le dimensioni della digital citizenship nel terzo modello ossia in quello che raccoglie tutte le variabili indipendenti rilevate.
Dallo studio risulta che predittori signi'cativi della cittadinanza digitale per gli insegnanti del campione sono gli anni di esperienza lavorativa, l'uso degli social network per l'insegnamento e la percezione di ef'cacia nell’uso di Internet.
L’ultimo caso che analizziamo è l’articolo “A multivariate approach to predicting student outcomes in web-enabled blended learning courses” di Nick Z. Zacharis (2015) il cui obiettivo è quello di de'nire un modello per predire gli studenti a rischio di ottenere scarsi risultati nei corsi erogati in modalità blended. L’autore identi'ca alcuni elementi chiave per l’analisi di cui alcuni strettamente legati al blended, altri al tipo di ricerca condotta. Come afferma, i ricercatori devono scegliere le attività (e di conseguenza le variabili) che possono fornire indicazioni sugli studenti che rischiano il fallimento; molto in queste stime dipende o va interpretato in base al design del corso; i docenti dei corsi blended dovrebbero dedicare una parte delle loro attività didattiche nell’analisi dei dati registrati nelle piattaforme utilizzate (LMS) per le quali nuove competenze sono necessarie. I dati raccolti riguardano 134 matricole in un corso erogato in modalità blended di “Introduction to Computer Science using Java” e sono stati estratti dai log dell’LMS che ospita i corsi (Moodle). Oltre a variabili sul tempo trascorso in piattaforma e sul numero di visualizzazioni delle risorse, di completamento e controllo dei quiz, delle sessioni di connessione, l’autore individua speci'che variabili indipendenti fra cui: Repo Messages, come somma di tutte le interazioni con i messaggi prodotti o soltanto letti, importante poiché il corso richiede alti livelli di interattività; Content Creation Contribution, che misura la partecipazione degli studenti nella costruzione di wiki e blog.
La variabile dipendente è rappresentata in questo caso dalla performance degli studenti intesa come voto 'nale del corso.
Gli autori conducono innanzitutto un’analisi sulle singole variabili (29) calcolando per ognuna la correlazione Rcon la variabile indipendente e il coef'ciente di determinazione R2. In seguito, i 14 predittori signi'cativamente associati con la variabile indipendente sono stati inseriti in una regressione multivariata stepwise dalla quale è risultato, a partire dal valore di R2, che 4 variabili spiegano il 52% della varianza della y (AdjR2 = 0,505). La lettura e la scrittura dei post pare inOuenzare da sola il 37% della varianza.
Lo studio si conclude con una regressione logistica 'nalizzata a veri'care quanti studenti del campione possono essere considerati a rischio. Della regressione logistica, però, parleremo nel prossimo capitolo.
122 - Analisi Multivariata e Learning Analytics: metodi e applicazioni