Statistiske tester er brukt i hypotesetesting. De kan brukes til å:
- avgjøre om en prediktor variabel har en statistisk signifikant forhold til et resultat som variabel.
- estimere forskjellen mellom to eller flere grupper.
Statistiske tester anta en nullhypotesen om ingen sammenheng eller ingen forskjell mellom gruppene. Da vil de finne ut om de observerte data faller utenfor rekkevidden av verdier spådd av nullhypotesen.,
Hvis du allerede vet hva slags variabler du arbeider med, kan du bruke flytskjema for å velge den rette statistisk test for dine data.
Statistiske tester flytskjema
Hva gjør en statistisk test gjøre?
Statistiske tester arbeid ved å beregne en test statistikk – et tall som beskriver hvor mye forholdet mellom variablene i testen skiller seg fra nullhypotesen om ingen sammenheng.
Det regner så ut en p-verdi (sannsynlighet verdi)., P-verdi anslår hvor sannsynlig det er at du vil se forskjellen beskrevet av test-statistikk hvis nullhypotesen om ingen sammenheng var sant.
Hvis verdien av test-statistikk er mer ekstreme enn statistikk beregnet ut fra nullhypotesen, så du kan utlede en statistisk signifikant sammenheng mellom prediktor og variablene.
Hvis verdien av test-statistikken er mindre ekstrem enn den beregnet ut fra nullhypotesen, så du kan utlede ingen statistisk signifikant sammenheng mellom prediktor og variablene.,
Når du skal utføre en statistisk test
Du kan utføre statistiske tester på data som har blitt samlet i en statistisk gyldig måte – enten gjennom et eksperiment, eller gjennom observasjoner gjort ved hjelp av sannsynligheten for prøvetaking metoder.
For en statistisk test for å være gyldig, kan du prøve størrelsen må være stort nok til å anslå den sanne fordelingen av befolkningen blir undersøkt.
for Å finne ut hvilke statistiske tester for å bruke, trenger du å vite:
- om dataene oppfyller visse forutsetninger.
- typer av variabler som du arbeider med.,
Statistiske forutsetninger
Statistiske tester gjøre noen felles forutsetninger om data de tester:
- Uavhengighet av observasjoner (en.k.a. ingen autocorrelation): observasjoner/variabler som er med i testen er ikke i slekt (for eksempel flere målinger av en enkelt test emne er ikke uavhengige, mens målinger av flere ulike testpersonene er uavhengige).
- Homogenitet i variansen: variansen innenfor hver gruppe blir sammenlignet er lik blant alle grupper., Hvis en gruppe har mye mer variasjon enn andre, vil det begrense teste effektiviteten.
- Normalitet av data: data følger en normalfordeling (en.k.a. et bell-kurve). Denne forutsetningen gjelder bare til kvantitative data.
Hvis dataene ikke oppfyller forutsetningen om normalitet eller homogenitet i variansen, kan du være i stand til å utføre en nonparametric statistisk test, som gir deg mulighet til å gjøre sammenligninger, uten noen forutsetninger om data distribusjon.,
Hvis dataene ikke oppfyller forutsetningen om uavhengighet av observasjoner, du kan være i stand til å bruke en test som står for struktur i dataene (gjentatt-tiltak for prøver eller tester som inkluderer blokkering av variabler).
Typer variabler
typer variabler har du vanligvis finne ut hva slags statistisk test som du kan bruke.
Kvantitative variabler representerer mengder av ting (f.eks. antall trær i en skog). Typer av kvantitative variabler inkluderer:
Kategoriske variabler representerer grupperinger av ting (f.eks. ulike treslag i en skog)., Typer av kategoriske variabler inkluderer:
Velg testen som passer til hvilke typer prediktor og variablene du har samlet inn (hvis du gjør et eksperiment, disse er de uavhengige og avhengige variabler). Se tabellene under for å se hvilken test som stemmer best overens med din variabler.
Velge en parametrisk test: regresjon, sammenligningen, eller korrelasjon
Parametriske tester vanligvis har strengere krav enn nonparametric tester, og er i stand til å lage sterkere slutninger fra data. De kan bare bli utført med data som fester seg til felles forutsetninger av statistiske tester.,
De mest vanlige typer parametrisk test omfatter regresjon tester, sammenligning tester, og korrelasjonen tester.
Regresjon tester
Regresjon tester er brukt for å teste årsak-og-virkning-relasjoner. De ser for effekten av en eller flere kontinuerlige variabler på en annen variabel.,
Prediktor variabel | Utfallet variabel | Forskning spørsmålet eksempel | |
---|---|---|---|
Enkel lineær regresjon |
|
|
Hva er effekten av inntekt på levetid?, |
Multippel lineær regresjon |
|
|
Hva er effekten av inntekt og minutter trening per dag på lang levetid? |
Logistisk regresjon |
|
|
Hva er effekten av narkotika dosering på overlevelsen til et test-subjekt?, |
Sammenligning tester
Sammenligning tester se etter forskjeller mellom gruppen betyr. De kan brukes til å teste effekten av en kategorisk variabel på middelverdien av noen andre kjennetegn.
T-tester brukes når du sammenligner hjelp av nøyaktig to grupper (f.eks. den gjennomsnittlige høyden av menn og kvinner). ANOVA og MANOVA tester brukes når du sammenligner hjelp av mer enn to grupper (f.eks. den gjennomsnittlige høyden av barn, tenåringer og voksne).,
Prediktor variabel | Utfallet variabel | Forskning spørsmålet eksempel | |
---|---|---|---|
– Paret t-test |
|
|
Hva er effekten av to ulike test prep-programmer på gjennomsnittlig eksamen score for studenter fra samme klasse?, |
Uavhengig t-test |
|
|
Hva er forskjellen i gjennomsnittlig eksamen skår for elever fra to forskjellige skoler? |
ANOVA |
|
|
Hva er forskjellen i gjennomsnittlig smerte nivåer blant post-kirurgiske pasienter gitt tre ulike smertestillende?, |
MANOVA |
|
|
Hva er effekten av blomst arter på petal lengde, petal bredde, og stilklengde? |
Korrelasjon tester
Korrelasjon tester sjekk om to variabler er relatert uten forutsatt årsak-og-virkning-relasjoner.
Disse kan brukes til å teste om to variablene du ønsker å bruke i (for eksempel) en multippel regresjon test er autocorrelated.,
Predictor variable | Outcome variable | Research question example | |
---|---|---|---|
Pearson’s r | Continuous | Continuous | How are latitude and temperature related?, |
Velge en nonparametric test
Ikke-parametriske tester ikke gjøre så mange forutsetninger om data, og er nyttige når ett eller flere av de vanligste statistiske forutsetninger er brutt. Imidlertid, de slutninger de gjør ikke så sterk som med parametriske tester.,h>Wilcoxon Rank-Sum test
- Kategoriske
- 2 grupper
- Kvantitative
- gruppene kommer fra ulike populasjoner
- Kategoriske
- 2 grupper
- Kvantitative
- grupper kommer fra den samme populasjonen
Flytskjema: velge en statistisk test
Dette flytskjema hjelper deg med å velge blant parametriske tester., For nonparametric alternativer, se tabellen ovenfor.
Ofte stilte spørsmål om statistiske tester
Statistiske tester vanlig å anta at:
- data er normalfordelt
- grupper som blir sammenlignet har lik varians
- data er selvstendig
Hvis dataene ikke oppfyller disse forutsetningene kan du fortsatt være i stand til å bruke en nonparametric statistisk test, som har færre krav, men også gjøre svakere slutninger.,
En test statistikk er et tall beregnet av en statistisk test. Det beskriver hvor langt din observerte data er fra nullhypotesen om ingen sammenheng mellom variabler eller ingen forskjell blant eksempel grupper.
test-statistikken viser hvor forskjellige to eller flere grupper er fra den generelle befolkningen mener, eller hvor forskjellig en lineær skråningen er fra skråningen spådd av en null-hypotese. Ulike test-statistikken er brukt i ulike statistiske tester.
Statistisk signifikans er et begrep som brukes av forskere til å hevde at det er lite sannsynlig at deres observasjoner kan ha skjedd under nullhypotesen av en statistisk test. Betydningen er vanligvis merket med en p-verdi, eller sannsynligheten verdi.
Statistisk signifikans er vilkårlig – det kommer an på terskelen, eller alfa-verdi, valgt av forskeren. Den vanligste grensen er satt til p < 0.05, noe som betyr at data er sannsynlig at mindre enn 5% av tiden under nullhypotesen.,
Når p-verdien faller under den valgte verdien, så sier vi resultatet av testen er statistisk signifikant.
Kvantitative variabler alle variabler der dataene representerer beløp (for eksempel høyde, vekt, alder).
Kategoriske variabler alle variabler der dataene representerer grupper. Dette omfatter plasseringer (f.eks. avsluttere i et løp), klassifikasjoner (for eksempel merker av korn), og binære utfall (f.eks. mynt).,
Du trenger å vite hva slags variabler, arbeider du med å velge riktig statistisk test for dine data og tolke resultater.
Diskrete og kontinuerlige variabler er to typer av kvantitative variabler:
- Diskrete variabler representerer teller (f.eks. antall objekter i en samling).
- Kontinuerlig variabler representerer målbare mengder (f.eks. vann volum eller vekt).