Figura 7.6 - Diagramma di Shepard per MDS metrico (i valori nel plot sono stati calcolati usando la funzione Shepard, libraria: MASS).
Su questi stessi dati è possibile applicare anche un MDS non metrico. Poiché l’approccio classico è un sottogruppo dell’approccio ordinale, otterremmo una con.gurazione simile. Nel nostro caso speci.co le due con.gurazioni (Figure 7.4 e 7.7) tendono a convergere a meno di una trasformazione di simmetria/mirroring.
Proponiamo uno scaling multidimensionale ordinale sul secondo dataset citato, composto da variabili ordinali e riferito alle opinioni (espresse in una scala a 4 livelli) degli studenti sugli elementi migliorati dall’uso dei sistemi di e-proctoring nello svolgimento degli esami, in particolare: concentrazione, attenzione, gestione del tempo, ansia, comprensione, motivazione. Il MDS applicato in questo caso utilizza un numero inferiore di dimensioni rispetto alle 6 variabili per descrivere le opinioni degli studenti sui sistemi di e-proctoring. Le dimensioni identi.cate contengono le opinioni sui sei elementi e le riuniscono.
Esistono più funzioni per svolgere un MDS ordinale. Molto utilizzata è isoMDS della libreria MASS. Questa, tuttavia, funziona solo in caso di distanze non nulle e positive. Di conseguenza esclude la possibilità di conservare in uno stesso campione unità statistiche con comportamenti identici. Come alternativa abbiamo usato nell’esempio precedente (Figura 7.7) e useremo anche in questo che segue la funzione metaMDS del pacchetto vegan. Mentre il software calcola la soluzione che meglio ottimizza i dati nel campione nel numero di dimensioni indicate fra gli argomenti, il sistema ci mostra il valore di stress per ciascun tentativo di ottimizzazione dei dati. Viene de.nita alla .ne una con.gurazione con un univoco valore di stress.
Figura 7.7 - MDS non metrico per il dataset degli studenti del CdL in Digital Education: risultati della funzione metaMDS (libreria: vegan) rielaborati in forma gra.ca attraverso la funzione ggscatter (libreria: ggpubr). La con.gurazione tende a convergere con quella in Figura 4.4 a meno di una simmetria/mirroring.
In Figura 7.8 vediamo i valori dello stress calcolati su un massimo di 8 dimensioni (dato che, come abbiamo detto, plottare i valori dello stress ottenuti da più soluzioni con numeri diversi di dimensioni è una tecnica per scegliere il numero di dimensioni da utilizzare nell’analisi).
Questo è un caso di dif.cile interpretazione. Qual è il numero ottimale di dimensioni da selezionare? Non esiste un punto in cui sia evidente una variazione di tendenza. Si propenderebbe tra 3 e 4 bilanciando la necessità di ridurre il numero di dimensioni con quella di trattenere la maggiore quantità di informazione. Se consideriamo le prime 4 coordinate, queste saranno quelle su cui applicare, ad esempio, una cluster analysis.
Figura 7.8 - Plot dimensioni/stress per individuare il numero di dimensioni da utilizzare nell’analisi.
Tuttavia per una rappresentazione gra.ca visualizziamo i risultati della soluzione a 2 dimensioni (Figura 7.9). Calcoliamo poi i cluster con kmeans e k = 3 (Figura 7.10).
Lo stress calcolato per la soluzione a 2 dimensioni è pari a 0,13, un valore che comincia ad essere meno rassicurante rispetto alle indicazioni che ci siamo dati (good = 0.05) ma accettabile. Per ottenere con.gurazioni che meglio riescano a descrivere il dataset, oltre a usare soluzioni a più dimensioni, potremmo fare ulteriori tentativi di analisi modi.cando la tipologia di distanza che abbiamo calcolato (passare dalla distanza euclidea a quella di Minkowski o Manhattan). Il diagramma di Shepard (Figura 7.11) e i valori di R2, tuttavia, indicano che il modello .tta bene con i risultati (R2= 0,982).