Tabella 3.4 - Tabella di contingenza per le variabili CORSO DI LAUREA, PERFORMANCE e ANSIA in un dataset relativo alla percezione dei sistemi di e-proctoring in ambito universitario. Nella prima colonna sono presenti variabili interattive che rappresentano due modalità combinate da due variabili.
Quando questo non è possibile o è troppo complesso per il grande numero di variabili e modalità, lavoriamo su un’analisi delle corrispondenze multiple
(MCA) dove le tabelle di contingenza vengono riproposte nella forma della matrice degli indicatori (Tabella 3.5) che riporta in un sistema binario il dataset per unità statistiche o della matrice di Burt (Tabella 3.6) che incrocia le frequenze su più modalità.
Tabella 3.5 - Matrice degli indicatori. Per ogni unità statistica nelle righe è riportato 1 in corrispondenza della modalità selezionata per ciascuna variabile (colonne) e 0 per le altre modalità.
Corso di laurea
Ansia
Performance
BLD 006
BLD 023
BLD 126
FIM 049
MED 054
MED 055
L1
L2
L3
L4
L1
L2
L3
L4
BLD 006
40
0
0
0
0
0
14
5
10
11
10
16
12
2
BLD 023
0
68
0
0
0
0
27
18
13
10
28
24
12
4
BLD 126
0
0
75
0
0
0
7
15
23
30
9
16
39
11
FIM 049
0
0
0
35
0
0
17
9
5
4
7
23
5
0
MED 054
0
0
0
0
52
0
13
14
17
8
8
23
20
1
MED 055
0
0
0
0
0
53
20
13
11
9
6
32
15
0
L1
14
27
7
17
13
20
98
0
0
0
32
52
9
5
L2
5
18
15
9
14
13
0
74
0
0
12
32
29
1
L3
10
13
23
5
17
11
0
0
79
0
8
28
38
5
L4
11
10
30
4
8
9
0
0
0
72
16
22
27
7
L1
10
28
9
7
8
6
32
12
8
16
68
0
0
0
L2
16
24
16
23
23
32
52
32
28
22
0
134
0
0
L3
12
12
39
5
20
15
9
29
38
27
0
0
103
0
L4
2
4
11
0
1
0
5
1
5
7
0
0
0
18
Tabella 3.6 - Tabella di Burt. Sulle righe e sulle colonne sono presenti le modalità delle variabili nello studio. Le celle contengono le frequenze con cui si manifestano due modalità.
La Tabella 3.5 anticipa la considerazione che nell’analisi delle corrispondenze multiple possiamo ottenere visualizzazioni gra1che della similarità fra variabili (colonne, Figura 3.11) ma anche fra le unità statistiche (righe, Figura 3.12).
Le funzioni della libreria factoextra forniscono delle visualizzazioni dove compaiono insieme i valori di righe e colonne (Figura 3.13) oppure righe con le modalità di una sola variabile (Figura 3.14).
Restano invariati gli indicatori rilevati e la loro interpretazione. In Figura 3.15 vediamo che le prime due dimensioni spiegano il 27,545% della varianza. Le coordinate e i valori ctr e cos2 sono forniti per righe (individui) e colonne (modalità).
Figura 3.11 - MCA sulle variabili CORSI DI LAUREA, PERFORMANCE e ANSIA in un dataset relativo alla percezione dei sistemi di e-proctoring in ambito universitario (funzione fviz_mca_var, pacchetto factoextra).
Figura 3.12 - MCA sulle unità statistiche rispetto a CORSI DI LAUREA, PERFORMANCE e ANSIA in un dataset relativo alla percezione dei sistemi di e-proctoring in ambito universitario (funzione fviz_mca_ind, pacchetto factoextra).
Figura 3.13 - MCA su modalità e unità statistiche rispetto a CORSI DI LAUREA, PERFORMANCE e ANSIA in un dataset relativo alla percezione dei sistemi di e-proctoring in ambito universitario (funzione fviz_mca_biplot, pacchetto factoextra).
Figura 3.14 - MCA per variabili su modalità e unità statistiche rispetto a CORSI DI LAUREA, PERFORMANCE e ANSIA in un dataset relativo alla percezione dei sistemi di e-proctoring in ambito universitario (funzione fviz_ellipses, pacchetto factoextra).
Figura 3.15 – Risultati dalla funzione summary applicati ai risultati di una MCA realizzata in R con la funzione MCA, libreria FactoMineR: varianza, ctr e cos2 per unità statistiche e modalità, eta2 per le variabili categoriali.
Nelle MCA, alcune variabili del dataset possono essere considerate supplementari (o illustrative), ciò signi1ca che esse non entrano nell’analisi per estrarre le dimensioni ma i loro valori sono predetti e confrontati con i dati inseriti nel calcolo. Questa possibilità, comune ad esempio alla cluster analysis, permette di usare la MCA come tecnica predittiva.