testy statystyczne są wykorzystywane w testowaniu hipotez. Można ich użyć do:
- określenia, czy zmienna predykcyjna ma statystycznie istotną zależność ze zmienną wyniku.
- oszacuj różnicę między dwiema lub więcej grupami.
testy statystyczne zakładają hipotezę zerową braku związku lub różnicy między grupami. Następnie określają, czy obserwowane dane mieszczą się poza zakresem wartości przewidywanych przez hipotezę zerową.,
Jeśli już wiesz, z jakimi typami zmiennych masz do czynienia, możesz użyć schematu blokowego, aby wybrać odpowiedni test statystyczny dla swoich danych.
SCHEMAT BLOKOWY testów statystycznych
do czego służy test statystyczny?
testy statystyczne działają poprzez obliczanie statystyki testu-liczby, która opisuje, jak bardzo zależność między zmiennymi w teście różni się od hipotezy zerowej braku związku.
następnie oblicza wartość p (wartość prawdopodobieństwa)., Wartość p szacuje, jak prawdopodobne jest, że można zobaczyć różnicę opisaną przez statystykę badania, jeśli hipoteza zerowa bez związku były prawdziwe.
Jeśli wartość statystyki badania jest bardziej ekstremalne niż statystyka obliczona z hipotezy zerowej, to można wywnioskować statystycznie istotny związek między predyktorem i zmiennych wyniku.
Jeśli wartość statystyki badania jest mniej ekstremalne niż ten obliczony z hipotezy zerowej, to można wywnioskować nie statystycznie istotny związek między predyktorem i zmiennych wyniku.,
kiedy wykonać test statystyczny
można wykonać testy statystyczne na danych, które zostały zebrane w sposób statystycznie poprawny – albo poprzez eksperyment, lub poprzez obserwacje wykonane przy użyciu metod próbkowania prawdopodobieństwa.
aby test statystyczny był ważny, wielkość próbki musi być wystarczająco duża, aby zbliżyć rzeczywisty rozkład badanej populacji.
aby określić, jakiego testu statystycznego użyć, musisz wiedzieć:
- czy Twoje dane spełniają określone założenia.
- typy zmiennych, z którymi masz do czynienia.,
założenia statystyczne
testy statystyczne przyjmują pewne wspólne założenia dotyczące danych, które testują:
- niezależność obserwacji (a.k.a. brak autokorelacji): obserwacje / zmienne, które uwzględniasz w teście, nie są ze sobą powiązane (na przykład wielokrotne pomiary jednego podmiotu testowego nie są niezależne, podczas gdy pomiary wielu różnych podmiotów testowych są niezależne).
- jednorodność wariancji: wariancja w każdej porównywanej grupie jest podobna we wszystkich grupach., Jeśli jedna grupa ma znacznie większą zmienność niż inne, ograniczy to skuteczność testu.
- normalność danych: dane są zgodne z rozkładem normalnym (aka krzywa dzwonka). Założenie to dotyczy wyłącznie danych ilościowych.
Jeśli Twoje dane nie spełniają założeń normalności lub jednorodności wariancji, możesz być w stanie wykonać nieparametryczny test statystyczny, który pozwala na dokonywanie porównań bez żadnych założeń dotyczących rozkładu danych.,
Jeśli Twoje dane nie spełniają założenia niezależności obserwacji, możesz być w stanie użyć testu, który odpowiada strukturze w Twoich danych (testy powtarzalnych pomiarów lub testy zawierające zmienne blokujące).
typy zmiennych
typy zmiennych, które posiadasz, zazwyczaj określają, jakiego typu testu statystycznego możesz użyć.
zmienne ilościowe reprezentują ilości rzeczy (np. liczbę drzew w lesie). Rodzaje zmiennych ilościowych obejmują:
zmienne kategoryczne reprezentują grupy rzeczy (np. różne gatunki drzew w lesie)., Rodzaje zmiennych kategorycznych obejmują:
wybierz test, który pasuje do typów zmiennych predykcyjnych i wynikowych, które zebrałeś (jeśli robisz eksperyment, są to zmienne niezależne i zależne). Zapoznaj się z poniższymi tabelami, aby zobaczyć, który test najlepiej pasuje do Twoich zmiennych.
wybór testu parametrycznego: regresja, porównanie lub korelacja
testy parametryczne zwykle mają bardziej rygorystyczne wymagania niż testy nieparametryczne i są w stanie wyciągnąć silniejsze wnioski z danych. Mogą one być prowadzone wyłącznie z danymi, które są zgodne ze wspólnymi założeniami badań statystycznych.,
do najczęstszych typów testów parametrycznych należą testy regresyjne, testy porównawcze i testy korelacyjne.
testy regresyjne
testy regresyjne są używane do testowania relacji przyczynowo-skutkowych. Szukają wpływu jednej lub więcej zmiennych ciągłych na inną zmienną.,
zmienna predykcyjna | zmienna wyniku | przykład pytania badawczego | |
---|---|---|---|
prosta regresja liniowa |
|
|
jaki jest wpływ dochodu na długowieczność?, |
regresja wielokrotna liniowa |
|
|
jaki jest wpływ dochodu i minut ćwiczeń dziennie na długowieczność? |
regresja logistyczna |
|
|
jaki jest wpływ dawki leku na przeżywalność badanego obiektu?, |
testy porównawcze
testy porównawcze Szukaj różnic między średnimi grupowymi. Mogą być używane do badania wpływu zmiennej kategorycznej na średnią wartość jakiejś innej cechy.
t-testy są używane przy porównywaniu środków dokładnie dwóch grup (np. średniej wysokości mężczyzn i kobiet). Testy ANOVA i MANOVA są używane do porównywania średniej wysokości więcej niż dwóch grup (np. średniej wysokości dzieci, nastolatków i dorosłych).,
zmienna predykcyjna | zmienna wyniku | przykład pytania badawczego | |
---|---|---|---|
sparowany test t |
|
jaki jest wpływ dwóch różnych programów przygotowujących do testów na średnie wyniki egzaminów dla uczniów z tej samej klasy?, | |
niezależny test t |
|
|
Jaka jest różnica w średnich wynikach egzaminu dla uczniów z dwóch różnych szkół? |
ANOVA |
|
|
Jaka jest różnica w średnim poziomie bólu u pacjentów pooperacyjnych otrzymujących trzy różne leki przeciwbólowe?, |
MANOVA |
|
|
jaki jest wpływ gatunków kwiatów na długość płatków, szerokość płatków i długość łodygi? |
testy korelacji
testy korelacji sprawdzają, czy dwie zmienne są ze sobą powiązane bez zakładania zależności przyczynowo-skutkowych.
można ich użyć do sprawdzenia, czy dwie zmienne, których chcesz użyć w (na przykład) teście regresji wielokrotnej, są autokorelowane.,
Predictor variable | Outcome variable | Research question example | |
---|---|---|---|
Pearson’s r | Continuous | Continuous | How are latitude and temperature related?, |
wybór testu nieparametrycznego
testy nieparametryczne nie składają się na tak wiele założeń dotyczących danych i są przydatne, gdy narusza się jedno lub więcej wspólnych założeń statystycznych. Jednak ich wnioski nie są tak silne, jak w przypadku testów parametrycznych.,h>test Wilcoxona Rank-Sum
- kategoryczny
- 2 grupy
- kategoryczne
- 2 grupy
- ilościowe
- grupy pochodzą z tej samej populacji
SCHEMAT BLOKOWY: wybór testu statystycznego
ten schemat blokowy pomaga wybrać spośród testów parametrycznych., W przypadku alternatyw nieparametrycznych sprawdź powyższą tabelę.
Najczęściej zadawane pytania dotyczące testów statystycznych
testy statystyczne zwykle zakładają, że:
- dane są normalnie rozłożone
- grupy, które są porównywane mają podobną wariancję
- dane są niezależne
Jeśli Twoje dane nie spełniają tych założeń, nadal możesz być w stanie użyć nieparametrycznego testu statystycznego, który ma mniej wymagań, ale także wyprowadza słabsze wnioski.,
statystyka testu to liczba obliczana za pomocą testu statystycznego. Opisuje, jak daleko obserwowanych danych jest od hipotezy zerowej nie ma związku między zmiennymi lub nie ma różnicy między grupami próbek.
statystyki testu mówi, Jak różne dwie lub więcej grup są od ogólnej średniej populacji, lub jak różne nachylenie liniowe jest od nachylenia przewidywane przez hipotezę zerową. Różne statystyki testów są używane w różnych testach statystycznych.
znaczenie statystyczne jest terminem używanym przez naukowców do stwierdzenia, że jest mało prawdopodobne, aby ich obserwacje mogły wystąpić pod hipotezą zerową testu statystycznego. Znaczenie jest zwykle oznaczane przez wartość p lub wartość prawdopodobieństwa.
znaczenie statystyczne jest dowolne – zależy od wybranego przez badacza progu lub wartości alfa. Najczęstszym progiem jest p < 0.05, co oznacza, że dane mogą wystąpić mniej niż 5% czasu pod hipotezą zerową.,
gdy wartość p spadnie poniżej wybranej wartości alfa, mówimy, że wynik testu jest statystycznie istotny.
zmienne ilościowe to dowolne zmienne, w których dane reprezentują kwoty (np. wzrost, wagę lub wiek).
zmienne kategoryczne to dowolne zmienne, w których dane reprezentują grupy. Obejmuje to rankingi (np. miejsca w wyścigu), klasyfikacje (np. marki zbóż) i wyniki binarne (np. rzuty monetą).,
musisz wiedzieć, z jakim typem zmiennych pracujesz, aby wybrać odpowiedni test statystyczny dla Twoich danych i zinterpretować wyniki.
zmienne dyskretne i ciągłe to dwa typy zmiennych ilościowych:
- zmienne dyskretne reprezentują liczby (np. liczbę obiektów w zbiorze).
- zmienne ciągłe reprezentują mierzalne ilości (np. objętość wody lub waga).