Quando avviamo ricerche su fenomeni educativi, che siano su larga scala o in contesti più ristretti, siamo consapevoli dei tanti fattori che intervengono nella determinazione degli eventi. L’uso dell’analisi multivariata risponde alla necessità − che emerge anche nel settore educativo − di maneggiare più variabili in un unico contesto e di sintetizzarle per ottenere informazioni su scenari ampi, ricchi di dati e complessi per via delle tante relazioni che in essi sono stabilite. È duplice il modo in cui opera l’analisi multivariata: da un lato riassume grandi quantità di informazioni in un numero inferiore di indicatori più comprensibili; dall’altro mostra quelle tendenze, quelle regolarità, quelle strutture latenti nelle relazioni fra i dati al 3ne di costruire modelli predittivi che non solo aderiscono (to t è il verbo inglese usato per esprimere questo concetto) alla struttura del campione osservato ma dell’intera popolazione di riferimento.
Siamo abituati inconsapevolmente a queste operazioni di summarisation proprie dell’analisi multivariata. Non solo nel contesto statistico dove, selezionando pochi indicatori, descriviamo distribuzioni a partire da una media e una deviazione standard. Ma anche nella quotidianità, dove ad esempio siamo in grado di percepire dettagli tridimensionali da una foto bidimensionale (Bartholomew et al., 2008).
La modalità attraverso cui si adoperano le tecniche di analisi multivariata porta al pensiero il paradigma della semplessità dell’ingegnere e neuro3siologo francese Alain Berthoz (2011) applicato anche in contesti didattici (Ferrari, 2013; Rivoltella & Rossi, 2012). Con questo termine lo studioso spiega il modo in cui in situazioni molto complesse, per spirito di sopravvivenza nei processi evolutivi, il cervello sia in grado di elaborare soluzioni semplici ma allo stesso tempo “eleganti ed ef3caci” che derivano da una riduzione della complessità, si basano sulle esperienze già compiute e anticipano il futuro.
Esse “non snaturano la complessità del reale: non sono né caricature, né scorciatoie, né riassunti” (Berthoz, 2011). Allo stesso modo, nel tipo di analisi oggetto della nostra discussione, attraverso l’uso di tecniche prede3nite e sempre incrementabili, molti dati vengono sintetizzati in fattori e poi modelli che senza perdere la complessità del contesto di partenza mostrano soluzioni organiche che contengono nuove conoscenze sul funzionamento dei sistemi, nel nostro caso educativi.
Nella de3nizione più stringente dell’insieme di tecniche che vanno sotto il nome di analisi multivariata, si sottolinea come in queste procedure le variabili debbano essere casuali e connesse fra loro in modo che le variazioni possano essere osservate solo sull’insieme dei dati e non in maniera isolata sulle singole variabili. Gli effetti registrati devono essere il risultato di eventi e variazioni che si manifestano simultaneamente. Tuttavia, nella pratica si è soliti utilizzare queste tecniche non solo per analisi multivariate ma anche in casi di analisi multivariabili, riferite cioè a più di due variabili, dove non vige il principio di simultaneità.
Per dirla con le parole di Hair e colleghi (2014):
“Multivariate analysis techniques are popular because they enable organizations to create knowledge and thereby improve their decision making. Multivariate analysis refers to all statistical techniques that simultaneously analyze multiple measurements on individuals or objects under investigation. […] To be considered truly multivariate, however, all the variables must be random and interrelated in such ways that their different effects cannot meaningfully be interpreted separately. Some authors state that the purpose of multivariate analysis is to measure, explain, and predict the degree of relationship among variates (weighted combinations of variables).” (ivi, p. 4) Prima di passare alla classi3cazione delle tecniche di analisi multivariata, prendiamo in considerazione due nuclei di informazioni che, riprese da Hair e colleghi (2014), ci danno un quadro completo dei processi di analisi che fanno riferimento alle tecniche multivariate. Gli autori forniscono:
un processo fatto di 6 fasi nel quale si svolge un’analisi multivariata in un approccio mirato alla costruzione di un modello di lettura dei fenomeni;
linee guida (quasi una 3loso3a, affermano) per l’analisi multivariata e l’interpretazione dei risultati.
Le Tabelle 2.2 e 2.3 mettono insieme i due elementi attribuendo a ciascuna fase di lavoro (colonna a sinistra) uno dei principi delle linee guida (colonna a destra). Le fasi di lavoro sono divise fra fasi di preparazione (Tabella 2.2) e fasi di costruzione/validazione del modello (Tabella 2.3); fra queste ultime, la quarta e la quinta hanno in comune il principio che valorizza l’errore, inteso come assenza di aderenza del modello ai dati. I principi focalizzano l’attenzione del ricercatore su scelte importanti come la de3nizione delle dimensioni del campione e la veri3ca della sua rappresentatività; valorizzano lo studio preparatorio di data screening ritenendolo fondamentale per interpretare i risultati e ripetere le analisi in caso di errore durante l’analisi; inducono a pensare ai modelli ottenuti come strettamente collegati da un lato alle teorie e ipotesi di partenza, dall’altro al contesto pratico di applicazione dei risultati.
Le varie fasi della ricerca legate in un percorso ordinato e lineare e i principi delle linee guida sono schemi generali che vanno adattati alle diverse tecniche; proprio per la loro linearità ci danno la possibilità di guardare ai fenomeni in maniera strutturata, ripercorrere le analisi alla luce dei risultati e anche trovare, sorprendentemente in uno scenario così regolato, soluzioni innovative e creative.