? Det er to måter du kan utføre statistiske analyser på datamaskinen. Det ene er å bruke en dedikert statistisk pakke som SPSS , Minitab eller SAS. Den andre er å bruke en mer generalisert data management eller regnearkprogram , for eksempel Microsoft Excel eller Open Office regneark . Sistnevnte har sine egne fordeler , hovedsakelig grunn til å være fri flyt , noe som betyr at det er ingen fast struktur til sine regneark og data kan organiseres slik du ønsker . Imidlertid dedikerte programmer er mer passende for dataanalyse for en rekke årsaker. Spekter av teknikker
Fordi statistisk analyse pakkene er spesielt produsert for statistisk dataanalyse , mens generelle programmene også dekke andre prosedyrer ved hjelp av data som regnskap skjemaer eller faktureringsformål , de tilbyr et bredere spekter av teknikker, diagrammer og grafer. De har også flere metoder for rengjøring og screening av data, for å forberede den for senere analyse. Også kan regneark-programmer bare støtte de fleste dataanalyser rett etter installasjon , og plug -ins kan være nødvendig for å få tilgang til mer kompliserte teknikker.
Data Management
p Det er sant som regneark-programmer gir mer kontroll over hvor og hvordan du kan organisere dine data . Men dette er også en ulempe . Mens du kan ikke bare flytte blokker av data rundt i et program som SPSS , er dette å holde dataene organisert på den mest optimale måten . En rad representerer alltid en enkel sak , og en kolonne en enkelt variabel . Dette gjør analyser raskere , siden programmet allerede vet hvor variablene og saker er. I et regneark , må dette angis manuelt med hver analyse.
Organisering av Output
dataanalyser programmer er også utformet for å holde produksjonen atskilt fra data selv . I et program som Excel, må resultatene av analysen være plassert i et regneark , der den risikerer å overskrive andre data -og utganger eller overskrives seg selv ved et uhell på et senere tidspunkt . Mest dedikerte analyseprogrammer ta dette et skritt videre og lagre utganger i separate filer til de viktigste data satt seg.
Nøyaktighet
Nøyaktigheten av frittstående statistisk analyse pakker er generelt mer troverdig enn generelle data lederprogrammer . Dette er av forskjellige grunner , inkludert muligheten for en celle i et regneark for å være både en formel og en verdi, noe som ikke er mulig i en statistikk pakke . Tester av Excel statistisk analyse add-on , Analyseverktøy , har vist unøyaktige resultater i analyser som regresjon og multippel regresjon. Dette problemet er særlig markert med mer komplekse analyser , slik som de som involverer kategoriske variabler .