las pruebas estadísticas se utilizan en las pruebas de hipótesis. Se pueden utilizar para:
- Determinar si una variable predictora tiene una relación estadísticamente significativa con una variable de resultado.
- estimar la diferencia entre dos o más grupos.
las pruebas estadísticas asumen una hipótesis nula de no relación o no diferencia entre los grupos. Luego determinan si los datos observados caen fuera del rango de valores predichos por la hipótesis nula.,
si ya sabe con qué tipos de variables está tratando, puede usar el diagrama de flujo para elegir la prueba estadística correcta para sus datos.
diagrama de flujo de pruebas estadísticas
¿qué hace una prueba estadística?
las pruebas estadísticas funcionan calculando una estadística de prueba: un número que describe cuánto difiere la relación entre las variables en su prueba de la hipótesis nula de no relación.
luego calcula un valor p (valor de probabilidad)., El valor de p estima la probabilidad de que vea la diferencia descrita por el estadístico de prueba si la hipótesis nula de no relación fuera verdadera.
si el valor del estadístico de prueba es más extremo que el estadístico calculado a partir de la hipótesis nula, entonces puede inferir una relación estadísticamente significativa entre el predictor y las variables de resultado.
si el valor del estadístico de prueba es menos extremo que el calculado a partir de la hipótesis nula, entonces puede inferir que no hay relación estadísticamente significativa entre el predictor y las variables de resultado.,
cuándo realizar una prueba estadística
Puede realizar pruebas estadísticas sobre datos que se han recopilado de manera estadísticamente válida, ya sea a través de un experimento o a través de observaciones realizadas utilizando métodos de muestreo probabilístico.
para que una prueba estadística sea válida, el tamaño de la muestra debe ser lo suficientemente grande como para aproximarse a la verdadera distribución de la población estudiada.
para determinar qué prueba estadística usar, debe saber:
- Si sus datos cumplen con ciertas suposiciones.
- Los tipos de variables con las que estás tratando.,
suposiciones estadísticas
las pruebas estadísticas hacen algunas suposiciones comunes sobre los datos que están probando:
- Independencia de las observaciones (también conocida como sin autocorrelación): las observaciones / variables que incluye en su prueba no están relacionadas (por ejemplo, las mediciones múltiples de un solo sujeto de prueba no son independientes, mientras que las mediciones de múltiples sujetos de prueba diferentes son independientes).
- homogeneidad de varianza: la varianza dentro de cada grupo que se compara es similar entre todos los grupos., Si un grupo tiene mucha más variación que otros, limitará la efectividad de la prueba.
- normalidad de los datos: los datos siguen una distribución normal (también conocida como curva de campana). Este supuesto se aplica únicamente a los datos cuantitativos.
si sus datos no cumplen con los supuestos de normalidad u homogeneidad de varianza, es posible que pueda realizar una prueba estadística no paramétrica, que le permite hacer comparaciones sin ningún supuesto sobre la distribución de datos.,
si sus datos no cumplen con el supuesto de independencia de las observaciones, es posible que pueda usar una prueba que tenga en cuenta la estructura de sus datos (pruebas de medidas repetidas o pruebas que incluyen variables de bloqueo).
tipos de variables
los tipos de variables que tiene generalmente determinan qué tipo de prueba estadística puede usar.
las variables cuantitativas representan cantidades de cosas (por ejemplo, el número de árboles en un bosque). Los tipos de variables cuantitativas incluyen:
Las variables categóricas representan agrupaciones de cosas (por ejemplo, las diferentes especies de árboles en un bosque)., Los tipos de variables categóricas incluyen:
elija la prueba que se ajuste a los tipos de variables predictoras y de resultado que ha recopilado (si está haciendo un experimento, estas son las variables independientes y dependientes). Consulte las tablas a continuación para ver qué prueba coincide mejor con sus variables.
elegir una Prueba paramétrica: regresión, comparación o correlación
las pruebas paramétricas generalmente tienen requisitos más estrictos que las pruebas no paramétricas, y pueden hacer inferencias más fuertes a partir de los datos. Solo pueden llevarse a cabo con datos que se adhieran a los supuestos comunes de las pruebas estadísticas.,
los tipos más comunes de pruebas paramétricas incluyen pruebas de regresión, pruebas de comparación y pruebas de correlación.
pruebas de regresión
las pruebas de regresión se utilizan para probar las relaciones de causa y efecto. Buscan el efecto de una o más variables continuas sobre otra variable.,
variable Predictora | variable de Resultado | pregunta de Investigación ejemplo | |
---|---|---|---|
regresión lineal Simple |
|
|
¿Cuál es el efecto de los ingresos sobre la longevidad?, |
de regresión lineal Múltiple |
|
|
¿Cuál es el efecto de los ingresos y de los minutos de ejercicio por día en la longevidad? |
regresión Logística |
|
|
¿Cuál es el efecto de la dosis de un medicamento en la supervivencia de un sujeto de prueba?, |
pruebas de comparación
las pruebas de comparación buscan diferencias entre las medias del grupo. Se pueden utilizar para probar el efecto de una variable categórica sobre el valor medio de alguna otra característica.
las pruebas T se utilizan cuando se comparan las medias de dos grupos precisos (por ejemplo, las alturas promedio de hombres y mujeres). Las pruebas ANOVA y MANOVA se utilizan cuando se comparan las medias de más de dos grupos (por ejemplo, las alturas promedio de niños, adolescentes y adultos).,
variable Predictora | variable de Resultado | pregunta de Investigación ejemplo | |
---|---|---|---|
prueba t pareada |
|
|
¿Cuál es el efecto de dos diferentes de preparación de la prueba de programas en el promedio de los puntajes de los exámenes para los estudiantes de la misma clase?, |
prueba T independiente |
|
|
¿Cuál es la diferencia en las calificaciones promedio de los exámenes para los estudiantes de dos escuelas diferentes? |
ANOVA |
|
|
¿Cuál es la diferencia en el promedio de los niveles de dolor entre post-quirúrgico de los pacientes que recibieron tres diferentes analgésicos?, |
MANOVA |
|
|
¿Cuál es el efecto de especies de flores de pétalos de longitud, pétalo de la anchura, y la longitud del tallo? |
pruebas de correlación
las pruebas de correlación comprueban si dos variables están relacionadas sin asumir relaciones de causa y efecto.
se pueden usar para probar si dos variables que desea usar en (por ejemplo) una prueba de regresión múltiple son autocorrelacionadas.,
Predictor variable | Outcome variable | Research question example | |
---|---|---|---|
Pearson’s r | Continuous | Continuous | How are latitude and temperature related?, |
elegir una prueba no paramétrica
las pruebas no paramétricas no hacen tantas suposiciones sobre los datos y son útiles cuando se violan una o más de las suposiciones estadísticas comunes. Sin embargo, las inferencias que hacen no son tan fuertes como con las pruebas paramétricas.,h>Wilcoxon Rank Sum test
- Categórica
- 2 grupos
- Cuantitativos
- grupos provienen de poblaciones diferentes
- Categórica
- 2 grupos
- Cuantitativos
- grupos provienen de la misma población
Diagrama de flujo: la elección de un estadístico de prueba
Este diagrama de flujo ayuda a elegir entre pruebas paramétricas., Para alternativas no paramétricas, consulte la tabla anterior.
Preguntas Frecuentes sobre las pruebas estadísticas
las pruebas estadísticas comúnmente asumen que:
- Los datos se distribuyen normalmente
- Los grupos que se están comparando tienen una varianza similar
- Los datos son independientes
Si sus datos no cumplen con estas suposiciones, es posible que aún pueda usar una prueba estadística no paramétrica, que tiene menos requisitos pero también hace inferencias más débiles.,
una estadística de prueba es un número calculado por una prueba estadística. Describe qué tan lejos están los datos observados de la hipótesis nula de no relación entre variables o ninguna diferencia entre los grupos de muestra.
La prueba estadística indica cómo diferentes de dos o más grupos de la población en general significa, o lo diferente que es un pendiente lineal es a partir de la pendiente predicho por una hipótesis nula. Diferentes estadísticas de prueba se utilizan en diferentes pruebas estadísticas.
significación estadística es un término utilizado por los investigadores para afirmar que es poco probable que sus observaciones pudieran haber ocurrido bajo la hipótesis nula de una prueba estadística. La significación se denota generalmente por un valor de P, O valor de probabilidad.
la significancia estadística es arbitraria-depende del umbral, o valor alfa, elegido por el investigador. El umbral más común es p < 0.05, lo que significa que es probable que los datos ocurran menos del 5% del tiempo bajo la hipótesis nula.,
Cuando el valor p cae por debajo del valor alfa elegido, entonces decimos que el resultado de la prueba es estadísticamente significativo.
las variables cuantitativas son todas las variables en las que los datos representan cantidades (por ejemplo, altura, peso o edad).
Las variables categóricas son cualquier variable donde los datos representan grupos. Esto incluye clasificaciones (por ejemplo, los lugares finales en una carrera), clasificaciones (por ejemplo, marcas de cereales) y resultados binarios (por ejemplo, giros de monedas).,
Necesita saber con qué tipo de variables está trabajando para elegir la prueba estadística correcta para sus datos e interpretar sus resultados.
las variables discretas y continuas son dos tipos de variables cuantitativas:
- Las variables discretas representan recuentos (por ejemplo, el número de objetos en una colección).
- Las variables continuas representan cantidades mensurables (por ejemplo, volumen o peso de agua).