CopertinaAnnamaria

Yüklə 21,24 Mb.

səhifə	58/89
tarix	14.09.2023
ölçüsü	21,24 Mb.
	#143325

1 ... 54 55 56 57 58 59 60 61 ... 89

ITALYAN DESSERTATSIYA. WORDdocx

6.1 – Cluster analysis

CAPITOLO 6

CLUSTER ANALYSIS

Al termine del capitolo, il lettore sarà in grado di:
· descrivere i principi e le fasi della cluster analysis, il concetto di distanza e gli algoritmi di clustering;
· interpretare un dendrogramma;
· elencare esempi della ricerca educativa nei quali è stata utilizzata la cluster analysis.

6.1 – Cluster analysis

Probabilmente anche quest’oggi ci sarà capitato di riorganizzare gli scomparti del frigo per tipologia di alimenti e data di scadenza, di riordinare le banconote nel nostro portafogli per taglio, di ripensare gli scaffali della libreria del salotto riempendo quelli più bassi con i libri per bambini, posizionando al centro quelli scolastici e in alto saggi e romanzi per una lettura piacevole e rilassata. Sono situazioni in cui abbiamo a che fare con la creazione di gruppi fra gli oggetti sulla base di una o più caratteristiche. Al termine di queste attività, probabilmente noteremo che gli oggetti raggruppati possiedono elementi comuni anche per altri fattori che non ci aspettavamo: i cassettoni del frigo pieni di frutta sono più colorati del resto degli scomparti; le banconote di grosso taglio hanno dimensioni maggiori; i libri per bambini molto spesso hanno una copertina cartonata diversamente dai testi scolastici.
Molte sono le circostanze nella vita quotidiana in cui ci ritroviamo a raggruppare gli oggetti di nostro interesse. Lo facciamo perché abbiamo bisogno di creare classi/cazioni e tassonomie (quante banconote di tagli diversi abbiamo nel portafoglio?), perché cerchiamo caratteristiche che accomunano elementi diversi (quali volumi fra quelli che abbiamo in casa sono destinati ai più piccoli?) o ancora perché desideriamo ridurre a una quantità osservabile le informazioni generate da un numero elevato di casi particolari (nel nostro frigo c’è quanto serve per un’alimentazione completa e varia?).
Queste pratiche della quotidianità sono comuni a numerosi contesti di ricerca, ogni settore scienti/co nel quale sia necessario produrre tassonomie, gerarchie e raggruppamenti fra gli elementi studiati. Discipline che fanno uso di processi di raggruppamento, solo per fare qualche esempio, sono l’archeologia, il marketing, la biologia e l’astronomia, la medicina e la linguistica.
Assumere l’esistenza di una naturale struttura in gruppi all’interno di una popolazione o di un campione ci permette di veri/care ipotesi sulle caratteristiche degli stessi gruppi e generarne di nuove sul funzionamento dei sistemi analizzati.
La cluster analysis comprende un insieme di metodi che permettono di raccogliere gli oggetti dell’analisi (unità statistiche, raggruppamenti e talvolta anche variabili) in gruppi (cluster) nei quali le osservazioni hanno caratteristiche simili all’interno e dissimili dagli altri raggruppamenti. La composizione dei cluster deve garantire che all’interno dei gruppi ci sia un’alta omogeneità fra gli oggetti che li compongono e che i gruppi costituiti all’interno del campione risultino eterogenei fra di loro. La distanza fra le unità di un cluster deve essere perciò minima mentre deve essere elevata la distanza fra i vari gruppi individuati af/nché si possano de/nire i pro/li caratterizzanti ciascun gruppo e rilevare le differenze che intercorrono fra di essi.
Lo scatterplot in Figura 6.1 mostra la distribuzione di un campione di studenti del CdL in Digital Education dell’Università degli Studi di Modena e Reggio Emilia diviso in quattro cluster in base ai risultati in trentesimi conseguiti in due esami. La collocazione nello spazio bi-dimensionale mostra evidenti distanze fra i gruppi: appartengono al gruppo A gli studenti che hanno sostenuto entrambi gli esami, al gruppo B gli studenti che hanno sostenuto solo l’Esame 2, al gruppo C gli studenti che hanno sostenuto solo l’Esame 1, al gruppo D gli studenti che non hanno sostenuto nessuno dei due esami (0 è il punteggio attribuito agli studenti che non hanno sostenuto l’esame). Notiamo che la distanza fra i punti interni ai gruppi è bassa, mentre la distanza fra i gruppi cerchiati in rosso è più rilevante. È questa una prima soluzione per distinguere i gruppi nel campione ma non è l’unica. Sia nel gruppo A che nel gruppo B appaiono come più distanti gli studenti che hanno conseguito un punteggio appena suf/ciente e che quindi, in una soluzione diversa a più cluster, potrebbero essere collocati in un gruppo diverso. Nell’analisi di un campione, possiamo scegliere di determinare molti gruppi che di conseguenza contengono un numero inferiore di unità più simili fra loro oppure un numero inferiore di gruppi di più alta numerosità che risultano meno omogenei all’interno. Aumentando il numero dei gruppi, aumenterà la similarità fra gli oggetti che li compongono e
otterremo pro/li più simili fra le unità, riducendo anche il numero di informazioni perse nella descrizione generale delle caratteristiche del cluster. Tuttavia, allo stesso tempo, lavorare su un numero più elevato di cluster potrebbe comportare un incremento di complessità nell’analisi.

Yüklə 21,24 Mb.

Dostları ilə paylaş:

1 ... 54 55 56 57 58 59 60 61 ... 89