Welcome to Our Website

3.2: estadísticas de dispersión


desviación estándar

la varianza, si bien tiene propiedades estadísticas útiles que la convierten en la base de muchas pruebas estadísticas, está en unidades cuadradas. Un conjunto de longitudes medidas en centímetros tendría una varianza expresada en centímetros cuadrados, que es simplemente raro; un conjunto de volúmenes medidos en \(cm^3\) tendría una varianza expresada en \(cm^6\), que es aún más raro. Tomando la raíz cuadrada de la varianza da una medida de dispersión que está en las unidades originales., La raíz cuadrada de la varianza paramétrica es la desviación estándar paramétrica, que nunca usará; viene dada por la función de hoja de cálculo STDEVP(Ys). La raíz cuadrada de la varianza de la muestra es dada por la función de hoja de cálculo STDEV (Ys). Siempre debe usar la desviación estándar de la muestra; de aquí en adelante, cuando vea «desviación estándar», significa la desviación estándar de la muestra.

la raíz cuadrada de la varianza de la muestra en realidad subestima un poco la desviación estándar de la muestra., Gurland y Tripathi (1971) idearon un factor de corrección que da una estimación más precisa de la desviación estándar, pero muy pocas personas lo usan. Su factor de corrección hace que la desviación estándar sea aproximadamente \(3\%\) más grande con un tamaño de muestra de \(9\), y aproximadamente \(1\%\) más grande con un tamaño de muestra de \(25\), por ejemplo, y la mayoría de las personas simplemente no necesitan estimar la desviación estándar con precisión. Ni SAS ni Excel usan la corrección de Gurland y Tripathi; la he incluido como una opción en mi hoja de cálculo de estadísticas descriptivas., Si utiliza la desviación estándar con la corrección de Gurland y Tripathi, asegúrese de decir esto cuando escriba sus resultados.

Fig. 3.2.1 izquierda: la distribución normal teórica. Derecha: frecuencias de 5.000 números generados aleatoriamente para ajustarse a la distribución normal. Las proporciones de estos datos dentro de 1, 2 o 3 desviaciones estándar de la media se ajustan bastante bien a lo esperado de la distribución normal teórica.,
Fig. 3.2.2 izquierda: frecuencias de 5.000 números generados aleatoriamente para ajustarse a una distribución sesgada a la derecha. Derecha: frecuencias de 5.000 números generados aleatoriamente para ajustarse a una distribución bimodal.

coeficiente de variación

El coeficiente de variación es la desviación estándar dividida por la media; resume la cantidad de variación como un porcentaje o proporción del total., Es útil cuando se compara la cantidad de variación para una variable entre grupos con diferentes medias, o entre diferentes variables de medición. Por ejemplo, el ejército de los Estados Unidos midió la longitud y el ancho del pie en 1774 hombres estadounidenses. La desviación estándar de la longitud del pie fue \(13.1 mm\) y la desviación estándar para la anchura del pie fue \(5.26 mm\), lo que hace que parezca que la longitud del pie es más variable que la anchura del pie. Sin embargo, los pies son más largos que anchos. Dividiendo por los medios (\(269.7 mm\) para la longitud, \(100.,6mm\) para el ancho), los coeficientes de variación son en realidad ligeramente más pequeños para la longitud (\(4.9\%\)) que para el ancho (\(5.2\%\)), que para la mayoría de los propósitos sería una medida más útil de la variación.

Ejemplo

Aquí están las estadísticas de dispersión para los datos de blacknose dace de la página web de tendencia central. En realidad, rara vez tendría alguna razón para reportar todos estos:

  • rango 90
  • varianza 1029.5
  • desviación estándar 32.09
  • coeficiente de variación 45.8%

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *