Figura 2.1 - Esempio di Log in una piattaforma Moodle.
Una tra le forme di raccolta dati più note e più diffuse è il questionario che, insieme a colloqui e interviste, permette di raccogliere opinioni e percezioni da parte degli intervistati, ma anche esaminare l’acquisizione di conoscenze o le performance. Distinguiamo questionari di valutazione sommativa predisposti nei corsi nelle forme di esami; i test standardizzati somministrati a livello nazionale e internazionale soprattutto con 3nalità comparative (es. PISA); test o scale, inventory validate nei contesti di ricerca per misurare, ad esempio, il possesso di abilità metacognitive (es. MAI, Metacognitive Awareness Inventory – Schraw & Dennison, 1994), i livelli di self-regulation nello studio (es. OSLQ, Online Self-regulated Learning Questionnaire – Barnard et al., 2009), le reazioni in presenza di un nuovo strumento tecnologico da utilizzare (es. CES, Computer Emotion Scale – Kay & Loverock, 2008) e così via. Quando pensiamo a questa tipologia di strumenti di ricognizione dei dati, immaginiamo che i questionari, al di là degli argomenti che affrontano, siano costituti da domande a risposta chiusa, con due o più opzioni di risposta, tali da permetterci di abbinare a ciascuna domanda soltanto un valore. È bene sapere che esistono software speci3ci o pacchetti nei programmi di elaborazione dati 3nalizzati all’analisi dei testi scritti e dei contenuti che ci restituiscono statistiche e rappresentazioni gra3che
su porzioni di testi o comunicazioni fra più soggetti (come quelle nei social network, ad esempio).
Introduciamo nell’elenco dei tipi di dati rilevabili anche quelli provenienti da sistemi come l’eye-tracking che, partendo dallo studio dei movimenti oculari, permette di misurare tempi e frequenze con i quali lo sguardo di un soggetto si sofferma su una parte di una immagine, di un testo o una pagina web. Usati come strumenti di scrittura in caso di gravi disabilità, queste tecnologie sono impiegate nell’ambito della ricerca per studiare in fasce di età diversi3cate i processi legati all’attenzione, l’usabilità dei sistemi informatici e sempre più auspicabilmente le competenze linguistiche, le attività cognitive e metacognitive, le emozioni, le modalità di apprendimento anche nei contesti multimediali (Porta & Rastelli, 2013; Alemdag & Cagiltay, 2018).
Anche l’osservazione diretta può essere usata come strumento di raccolta di dati quantitativi: in questo caso l’osservatore rileva i comportamenti dei soggetti attraverso griglie e schede che, rielaborate, possono essere usate come variabili che abbinano a ciascun comportamento osservato un numero pari alla frequenza con cui il comportamento è agito.
Abbiamo usato il termine variabile, fondamentale per avviare e comprendere ogni analisi statistica. Le variabili sono gli elementi operativi e osservabili in cui è scomposto un fenomeno e ai quali possiamo attribuire un valore (una modalità) per ciascun caso/soggetto/unità statistica. Il voto nell’esame di Statistica conseguito da ciascuno degli studenti iscritti al secondo anno di un determinato corso di laurea. Oppure l’altezza degli individui nati nel 1983. O ancora il piatto preferito tra 5 elencati da parte dei rispondenti a un’indagine di marketing. Questi esempi mostrano come nella fase di raccolta dei dati, due sono gli elementi da tenere in considerazione: le variabili, quindi gli eventi da osservare, e i soggetti/oggetti su cui rilevare l’occorrenza dell’evento, ossia campioni e popolazioni di riferimento.
Le variabili
Le classi3cazioni delle variabili sono determinate dalle caratteristiche proprie delle stesse e dalle modalità in cui vengono utilizzate.
Distinguiamo variabili qualitative e quantitative dal tipo di fenomeno che descrivono e dalla scala con cui vengono rilevate. Le modalità in cui si esprimono le prime sono caratteristiche nominali, le seconde valori numerici. Il colore preferito dei bambini della scuola dell’infanzia rappresenta quindi una variabile qualitativa, l’età degli stessi è una variabile quantitativa. Le variabili qualitative si distinguono a loro volta in categoriali e ordinali. Il colore preferito, riprendendo l’esempio, è una variabile qualitativa categoriale e si misura con l’uso di una scala qualitativa sconnessa in cui tutte le opzioni di risposta alla possibile domanda: “quale è il tuo colore preferito?” hanno uno stesso peso. Non c’è un ordine nei colori, una scala che ci dica che il colore rosso ha un valore più elevato per noi del colore verde. Il classico esempio di variabile qualitativa ordinale è quello del livello di istruzione. In questo caso le opzioni di risposta all’ipotetica domanda “quale è il tuo titolo di studi?” seguono un ordine ben preciso che ci permette di indicare un titolo come superiore all’altro. La scala usata in questo caso è una scala qualitativa ordinale dove le opzioni di risposta saranno licenza di scuola primaria, scuola secondaria di primo grado, scuola secondaria di secondo grado, laurea triennale, laurea magistrale, corsi post lauream, dottorato di ricerca. Per alcune procedure, associando a queste opzioni di risposta un valore numerico, la variabile qualitativa ordinale può essere trattata − seppur con estrema cautela − come una variabile quantitativa. Queste ultime si suddividono in discrete e continue a seconda che i valori numerici formulati siano rilevati, contati (ad es., numero di smartphone in una famiglia) o misurati con strumenti di misurazione e unità di misura (es. altezza di un individuo misurata in cm). Vengono rilevate con scale quantitative rapporto o non rapporto che si distinguono per il modo in cui viene ammesso il valore 0: realistico nelle prime, solo convenzionale nelle seconde.
Un particolare tipo di variabili (qualitative) sono quelle de3nite dicotomiche o binarie, quelle che cioè possono assumere soltanto due modalità: bianco/ nero, vero/falso, sì/no, uomo/donna e così via. Anche le variabili identi3cate come dummy sono dicotomiche (sono quantitative però): esse sono aggiunte nelle fasi di preparazione dei dati per indicare l’occorrenza di un fenomeno e trasformare una variabile categoriale in quantitativa. Una variabile dummy potrebbe ad esempio rilevare il fenomeno: “preferisco il giallo” dove i rispondenti possono scegliere questo colore fra molti. Per convenzione la modalità assunta sarà 1 in corrispondenza dei casi di soggetti che hanno indicato il colore giallo come il preferito, 0 per tutti gli altri colori.
Le trasformazioni sulle variabili possono condurre anche alla costruzione di variabili composte, cioè formate da due o più altre variabili del dataset che risultano prossime o per correlazioni statistiche o per legami concettuali e che, combinate, generano informazioni più esaurienti sui fenomeni (per una descrizione più completa si veda Song et al., 2013).
In altre classi3cazioni legate piuttosto all’uso che si fa delle variabili nelle analisi, possiamo distinguere le variabili esogene da quelle endogene per distinguere le variabili considerate interne al modello impiegato da quelle esterne. In alcuni dei metodi che descriveremo in seguito per de3nire relazioni fra i fenomeni osservati, si parla di variabili indipendenti e dipendenti: si ipotizza che le prime inNuenzino il comportamento delle seconde che sono in realtà molto spesso quelle al centro del nostro interesse. Nel linguaggio statistico le variabili indipendenti e dipendenti sono anche note rispettivamente con i nomi di predittori e variabile risposta.
Una distinzione da fare e che ci riporta a quanto detto nel primo capitolo, e cioè alla dif3coltà di conoscere 3no in fondo la realtà osservata, è quella fra variabili latenti e manifeste, osservate e non osservate. Gli eventi osservati sono sempre composti da due elementi non osservabili: il fenomeno in sé e un errore che nasce dalla misurazione, dal campionamento e così via. Vanno quindi distinte, in fase di analisi e discussione dei risultati, le variabili che possono essere osservate e sono manifeste da quei costrutti della cui esistenza siamo consapevoli ma che non possiamo rilevare perché latenti o non osservabili (de Lillo et al., 2007). Di questo avremo modo di parlare in maniera più approfondita a proposito delle tecniche di analisi (già ad esempio nel terzo capitolo).