Clustering analyse er en statistisk teknikk som brukes for å ordne sakene i kategorier, slik at sakene i hver kategori ligner på hverandre og forskjellig fra saker i andre kategorier . Hver kategori er en klynge . Samfunnsforskere bruker SPSS (Statistical Package for Social Sciences ) til å gjennomføre cluster analyser . I K- midler clustering forskeren angir antallet av klynger som ønskes. K er antall klynger forskere indikerer de ønsker. K - Means clustering tillater forskerne å klynge svært store datasett . Instruksjoner
Analyser data
en
Klikk på "Analyze" øverst th SPSS skjermen . Velg " Gi " fra drop -down menyen og "K - Means Cluster . "
2
Velg et utvalg av saker. I dialogboksen , klikk på " Variabler " og markere de variablene du ønsker å bruke i den første K - Means analyse. Klikk på venstre pil for å flytte variablene inn i boksen . Angi antall klynger , vanligvis fem i en gjennomsnittlig størrelse datasett, i boksen "Antall Clusters . " Antallet klynger må være mer enn to og ikke mer enn antall tilfeller. Klikk på " Iterate og klassifisere " i dialogboksen for å få cluster sentre . Klikk på " Skriv finalen. "
3
Inkluder hele datafil for den endelige K - Means analyse. Klikk på " Analyze" på toppen av SPSS skjermen . Velg " Gi " fra drop -down menyen og "K - Means Cluster . " I dialogboksen velger du " Variabler " og markere de variablene du ønsker å bruke. Klikk på venstre pilen. Angi antall klynger på fem i boksen "Antall Clusters . " Klikk på " Stem " i dialogboksen . Velg "Les Initial " for å få klyngen sentre fra prøven i trinn to . Klikk på " Lagre". Klikk på " Cluster medlemskap. " Klikk på " Fortsett".
Les Output
4
gjennomgang den første tabellen i produksjon , merket «Final Cluster Centers . " Toppen av tabellen har tallene 1 til 5 på tvers av den, noe som indikerer hver av de fem klynger. Den venstre kolonnen viser " REGR faktor score" ( regresjon faktor scorer eller hvor godt hver variabel spår score) for hver av analysene. Hvis du følger linjen ved siden av partituret en for analyse 1 til høyre , vil det gi deg den faktoren score for hver klynge .
5
Les neste bord i produksjonen ledet "Antall tilfeller i hvert klyngen. " Boksen til venstre viser de klynger av tall, en gjennom fem . Følg Cluster tallet til høyre og du vil finne antall tilfeller i at klyngen.
6
titt på den siste tabellen i produksjon , " Cluster medlemskap ", som viser hvilke saker er i hvert klynge . Sakene er listet i venstre kolonne og klyngen nummeret i kolonnen til høyre.