statistiske tests anvendes i hypotesetest. De kan bruges til at:
- bestemme, om en forudsigelsesvariabel har et statistisk signifikant forhold til en resultatvariabel.
- estimere forskellen mellem to eller flere grupper.
statistiske tests antager en nulhypotese om intet forhold eller ingen forskel mellem grupper. Derefter bestemmer de, om de observerede data falder uden for intervallet af værdier forudsagt af nulhypotesen.,
Hvis du allerede ved, hvilke typer af variabler, du har at gøre med, du kan bruge diagrammet til at vælge den rigtige statistiske test for dine data.
Statistiske tests flowchart
Hvad gør en statistisk test gøre?
statistiske tests fungerer ved at beregne en teststatistik – et tal, der beskriver, hvor meget forholdet mellem variabler i din test adskiller sig fra nulhypotesen om intet forhold.
det beregner derefter en p-værdi (sandsynlighedsværdi)., P-værdien estimerer, hvor sandsynligt det er, at du ville se forskellen beskrevet af teststatistikken, hvis nulhypotesen om intet forhold var sandt.hvis værdien af teststatistikken er mere ekstrem end den statistik, der beregnes ud fra nulhypotesen, kan du udlede et statistisk signifikant forhold mellem forudsigelses-og resultatvariablerne.
hvis værdien af teststatistikken er mindre ekstrem end den, der beregnes ud fra nulhypotesen, kan du udlede intet statistisk signifikant forhold mellem forudsigelses-og resultatvariablerne.,
Hvornår skal man udføre en statistisk test
Du kan udføre statistiske tests på data, der er indsamlet på en statistisk gyldig måde – enten gennem et eksperiment eller gennem observationer foretaget ved hjælp af sandsynlighedsprøvetagningsmetoder.
for at en statistisk test skal være gyldig, skal din prøvestørrelse være stor nok til at tilnærme den sande fordeling af den population, der undersøges.
for at bestemme hvilken statistisk test der skal bruges, skal du vide:
- om dine data opfylder visse antagelser.
- de typer variabler, du har at gøre med.,
Statistiske antagelser
Statistiske tests lave nogle fælles antagelser om data, at de test:
- Uafhængighed af observationer (en.k.en. ingen autokorrelation): De observationer/variabler, som du inkluderer i din test er ikke relateret (for eksempel, flere målinger af en enkelt test emne er ikke uafhængige, mens målinger af flere forskellige forsøgspersoner er uafhængige).variansens homogenitet: variansen inden for hver gruppe, der sammenlignes, er den samme blandt alle grupper., Hvis en gruppe har meget mere variation end andre, vil det begrænse testens effektivitet.
- normalitet af data: dataene følger en normal fordeling (alias en klokkekurve). Denne antagelse gælder kun for kvantitative data.
Hvis dine data ikke opfylder antagelserne om normalitet eller homogenitet af varians, kan du muligvis udføre en ikke-parametrisk statistisk test, som giver dig mulighed for at foretage sammenligninger uden antagelser om datafordelingen.,
Hvis dine data ikke opfylder antagelsen om uafhængighed af observationer, kan du være i stand til at bruge en test, der tegner sig for struktur i dine data (gentagen foranstaltninger tests eller undersøgelser, der omfatter blokering variabler).
variabletyper
de variabletyper, du normalt har, bestemmer, hvilken type statistisk test du kan bruge.
kvantitative variabler repræsenterer mængder af ting (f.eks. antallet af træer i en skov). Typer af kvantitative variabler omfatter:
kategoriske variabler repræsenterer grupperinger af ting (f.eks. de forskellige træarter i en skov)., Typer af kategoriske variabler inkluderer:
Vælg den test, der passer til de typer forudsigelses-og resultatvariabler, du har samlet (hvis du laver et eksperiment, er dette de uafhængige og afhængige variabler). Se nedenstående tabeller for at se, hvilken test der bedst matcher dine variabler.
Valg af en parametrisk test: regression, sammenligning, eller korrelation
Parametriske tests normalt har strengere krav end nonparametric tests, og er i stand til at gøre stærkere slutninger fra data. De kan kun udføres med data, der overholder de fælles antagelser om statistiske tests.,
de mest almindelige typer af parametrisk test omfatter regressionstest, sammenligningstest og korrelationstest.
regressionstest
regressionstest bruges til at teste årsag-og-effektforhold. De ser efter effekten af en eller flere kontinuerlige variabler på en anden variabel.,
Prædiktor variabel | Resultatet variabel | Forskning spørgsmålet eksempel | |
---|---|---|---|
Simpel lineær regression |
|
|
Hvad er effekten af indkomst på levetiden?, |
Multiple lineær regression |
|
|
Hvad er effekten af indkomst og minutters motion om dagen på levetiden? |
Logistisk regression |
|
|
Hvad er virkningen af et lægemiddel dosis på overlevelse i en test emne?, |
sammenlignende test
Sammenligning tests ser for forskelle blandt gruppens midler. De kan bruges til at teste effekten af en kategorisk variabel på middelværdien af en anden egenskab.
T-test anvendes ved sammenligning af midlerne til nøjagtigt to grupper (f.eks. ANOVA-og MANOVA-test anvendes ved sammenligning af midlerne til mere end to grupper (f.eks. gennemsnitshøjderne for børn, teenagere og voksne).,
Prædiktor variabel | Resultatet variabel | Forskning spørgsmålet eksempel | |
---|---|---|---|
Parret t-test |
|
|
Hvad er effekten af to forskellige test prep-programmer på den gennemsnitlige eksamen scores for elever fra samme klasse?, |
Uafhængig t-test |
|
|
Hvad er forskellen i gennemsnitlig eksamen scores for elever fra to forskellige skoler? |
ANOVA |
|
|
Hvad er forskellen i den gennemsnitlige smerte niveauer blandt post-kirurgiske patienter, der fik tre forskellige smertestillende midler?, |
MANOVA |
|
|
Hvad er effekten af blomst arter på kronblad længde, blad bredde, og stem længde? |
Korrelation test
Korrelation prøver tjekke, om to variable er relateret til hinanden uden at påtage årsag-og-virkning relationer.
disse kan bruges til at teste, om to variabler, du vil bruge i (for eksempel) en multipel regressionstest, er autokorrelerede.,
Predictor variable | Outcome variable | Research question example | |
---|---|---|---|
Pearson’s r | Continuous | Continuous | How are latitude and temperature related?, |
Valg af en nonparametric test
Ikke-parametriske tests ikke lave så mange antagelser om data, og er nyttigt, når et eller flere af fælles statistiske antagelser ikke er overholdt. Men de konklusioner, de gør, er ikke så stærke som med parametriske tests.,h>Wilcoxon Rank-Sum test
- Kategorisk
- 2 grupper
- Kvantitative
- grupper kommer fra forskellige populationer
- Kategorisk
- 2 grupper
- Kvantitative
- grupper kommer fra den samme population
Flowchart: valg af statistisk test
Dette diagram hjælper dig med at vælge blandt de parametriske test., For ikke-parametriske alternativer skal du kontrollere tabellen ovenfor.
Ofte stillede spørgsmål om statistiske test
Statistiske tests almindeligt at antage, at:
- data er normalfordelte
- de grupper, der sammenlignes, har samme varians
- de data, der er uafhængige
Hvis dine data ikke opfylder disse forudsætninger, du kan stadig være i stand til at bruge en nonparametric statistiske test, der har færre krav, men også gøre svagere slutninger.,
en teststatistik er et tal beregnet ved en statistisk test. Den beskriver, hvor langt dine observerede data er fra nulhypotesen om intet forhold mellem variabler eller ingen forskel mellem prøvegrupper.
teststatistikken fortæller dig, hvor forskellige to eller flere grupper er fra den samlede befolkningsgennemsnit, eller hvor forskellige en lineær hældning er fra den hældning, der er forudsagt af en nulhypotese. Forskellige teststatistikker anvendes i forskellige statistiske tests.
statistisk signifikans er et udtryk, som forskere bruger til at angive, at det er usandsynligt, at deres observationer kunne have fundet sted under nulhypotesen for en statistisk test. Betydning betegnes normalt med en p-værdi eller sandsynlighedsværdi.
statistisk betydning er vilkårlig – det afhænger af tærsklen eller alfa-værdien valgt af forskeren. Den mest almindelige tærskel er p < 0.05, hvilket betyder, at dataene sandsynligvis vil forekomme mindre end 5% af tiden under nulhypotesen.,
Når p-værdien falder under den valgte alfa-værdi, siger vi, at resultatet af testen er statistisk signifikant.
Du skal vide, hvilken type variabler du arbejder med for at vælge den rigtige statistiske test for dine data og fortolke dine resultater.
- diskrete variabler repræsenterer tæller (f.eks. antallet af objekter i en samling).
- kontinuerlige variabler repræsenterer målelige mængder (f.eks. vandvolumen eller vægt).