Tabella 7.1 - Voti di 5 studenti/esse del corso di “Tecniche di analisi dati” espressi in trentesimi.
A
B
C
D
E
A
/
B
3
/
C
1
2
/
D
5
2
4
/
E
3
6
4
8
/
Tabella 7.2 - Matrice delle distanze fra i voti degli studenti in Tabella 7.1 (ricordiamo che la distanza è una funzione de.nita positiva).
Usando un approccio metrico, nella rappresentazione dei punti (nella scelta delle coordinate in uno spazio a una dimensione) dovremmo rispettare esattamente i valori delle distanze come in Figura 7.1 dove, ad esempio, la distanza AC è pari a 1, la ED a 8 e la AB a 3 così come leggiamo nella matrice delle distanze in Tabella 7.2. Nell’approccio ordinale o non metrico invece distribuiamo i punti corrispondenti agli studenti conservando semplicemente l’ordine delle distanze senza preoccuparci dei valori numerici. In Figura 7.2, infatti la distanza fra i punti (voti degli studenti) E e D è certamente la più ampia ma non è pari a 8, così come la distanza fra A e C è la più piccola ma non è pari a 1. Allo stesso modo le distanze CE e CD sono uguali fra loro, le quarte nell’ordine di grandezza (essendo AC la distanza più piccola pari a 1, BC e BD pari a 2 e quindi seconde nell’ordine, AB e AE pari a 3 e quindi terze nell’ordine) ma non valgono 4 (la distribuzione dei punti nelle Figure 7.1 e 7.2 è puramente esempli.cativa e non è il frutto di rigorose procedure di analisi).
Figura 7.1 - Approccio classico/metrico del MDS: è rispettato il valore numerico delle distanze.