To viktige spørsmål i mange typer forskning er hvorvidt to variablene er korrelert , og hvis så , styrken (eller betydning ) av det forholdet. Er det en signifikant sammenheng , for eksempel mellom kjønn eller etnisitet og politisk tilhørighet ? Chi -kvadrat test er en mye brukt metode for å måle om en signifikant sammenheng mellom to nominelle eller kategoriske variabler som kjønn og politisk tilhørighet . Du trenger
datamaskin eller kalkulator
Sett med data
Statistikk bok eller manuell
Vis flere instruksjoner
en
Begynn med en hypotese før du starter din dataanalyse. En vanlig hypotese i mye forskning er at det ikke er noen korrelasjon mellom de to variablene av interesse. Den chi ( rimer med " min ") kvadrat-test måler nivået av avvik fra en gitt hypotese . Jo større chi-kvadrat -statistikken , desto mindre godt hypotesen passer til dataene. For eksempel anta at vi ser på et sett av data som ba 125 registrerte velgere ( 65 kvinner og 60 menn) sin politiske partitilhørighet ( Democratic eller republikaner ) . Anta vi vet fra tidligere forskning at 55 prosent av velgerne identifiserte seg som demokrater . Vår arbeidshypotese er at denne 55 prosent vil være jevnt fordelt mellom menn og kvinner.
2
beregne forventet verdier basert på en hypotese modell av politisk tilhørighet etter kjønn. Basert på 125 velgere , forventer vi at 55 prosent ( 69 velgere ) vil identifisere seg som demokrater . Etter kjønn , forventer vi at 36 kvinner og 33 menn vil uttrykke en preferanse for det demokratiske partiet , forlater 29 kvinner og 27 menn favoriserer det republikanske partiet . Organisere dataene i en to -for- to -matrise ( to rader og to kolonner ) . La partitilhørighet være kolonnen variabler og kjønn være rad- variabler .
3
sammenligne de faktiske verdiene fra dine data med de forventede verdiene du beregnet i trinn 2 . For dette eksempelet , la oss si at blant de 65 kvinnene , 44 prosent identifiserte seg som demokrater og 21 som republikanerne , mens 36 menn hevdet en demokratisk forankring og 24 foretrukket det republikanske partiet .
4
Beregn chi kvadrat - statistikk, som er summen av de kvadrerte forskjeller mellom de observerte og forventede verdier ( også kjent som residualene ) , dividert med de forventede verdier. Du trenger dette for de fire mulige kombinasjoner av kjønn og politisk tilhørighet er angitt i modellen. Hvis du bruker en datamaskin, kan mange statistiske og regneark -programmer beregne chi -kvadrat statistikk for deg. I vårt eksempel er summen av kvadrerte differensialer delt på forventede verdier 4.59 .
5
Finn ut om chi -kvadrat statistikk du beregnet i trinn 4 er statistisk signifikant . For å gjøre dette , må du vite to ting: de frihetsgrader og signifikansnivå . Frihetsgrader er antall rader i tabellen minus en, ganger antall kolonner minus en . Signifikansnivå refererer til muligheten for at den observerte korrelasjon kunne ha oppstått tilfeldig alene. Mange forskere foretrekker en .05 betydning nivå , noe som betyr at det er bare en fem prosent sannsynlighet for at den observerte sammenhengen er ren tilfeldighet . I vårt eksempel har vi bare en grad av frihet. Bruke statistikk bok (vanligvis i vedlegget ) , slå opp chi -kvadrat verdien som tilsvarer signifikansnivået og frihetsgrader . For vårt eksempel , er den chi -kvadrat verdi for en grad av frihet og 0,05 signifikansnivå 3.84. Vår verdi på 4,59 er større , noe som betyr at det er en statistisk signifikant sammenheng mellom kjønn og politisk tilhørighet , med kvinner er betydelig mer sannsynlig å identifisere seg som demokrater .