Welcome to Our Website

3.2: statistiques de Dispersion

écart type

La Variance, bien qu’elle possède des propriétés statistiques utiles qui en font la base de nombreux tests statistiques, est exprimée en unités carrées. Un ensemble de longueurs mesurées en centimètres aurait une variance exprimée en centimètres carrés, qui est juste bizarre; un ensemble de volumes mesurés dans \(cm^3\) aurait une variance exprimée dans \(cm^6\), ce qui est encore plus étrange. Prendre la racine carrée de la variance donne une mesure de dispersion qui est dans les unités d’origine., La racine carrée de la variance paramétrique est l’écart-type paramétrique, que vous n’utiliserez jamais; est donné par la fonction de feuille de calcul STDEVP(Ys). La racine carrée de la variance de l’échantillon est donnée par la fonction de feuille de calcul STDEV (Ys). Vous devriez toujours utiliser l’écart-type d’échantillon; à partir de là, quand vous voyez « écart-type », cela signifie que l’écart-type d’échantillon.

La racine carrée de la variance de l’échantillon effectivement sous-estime l’écart-type d’échantillon par un peu., Gurland et Tripathi (1971) ont proposé un facteur de correction qui donne une estimation plus précise de l’écart type, mais très peu de gens l’utilisent. Leur facteur de correction augmente l’écart-type d’environ \(3\%\) avec une taille d’échantillon de \(9\), et d’environ \(1\%\) avec une taille d’échantillon de \(25\), par exemple, et la plupart des gens n’ont tout simplement pas besoin d’estimer l’écart-type avec précision. Ni SAS ni Excel n’utilisent la correction Gurland et Tripathi; Je l’ai incluse en option dans ma feuille de calcul statistique descriptive., Si vous utilisez l’écart type avec la correction Gurland et Tripathi, assurez-vous de le dire lorsque vous rédigez vos résultats.

Fig. 3.2.1 gauche: la distribution normale théorique. Droite: fréquences de 5 000 nombres générés aléatoirement pour s’adapter à la distribution normale. Les proportions de ces données à l’intérieur de 1, 2 ou 3 écarts-types de la moyenne correspondent assez bien à celle attendue de la distribution normale théorique.,
Fig. 3.2.2 gauche: fréquences de 5 000 nombres générés aléatoirement pour s’adapter à une distribution biaisée vers la droite. Droite: fréquences de 5 000 nombres générés aléatoirement pour s’adapter à une distribution bimodale.

Coefficient de Variation

le Coefficient de variation est l’écart-type divisé par la moyenne; il résume le montant de la variation en pourcentage ou en proportion du total., Il est utile pour comparer la quantité de variation pour une variable entre des groupes avec des moyennes différentes, ou entre différentes variables de mesure. Par exemple, l’armée américaine a mesuré la longueur et la largeur du pied chez les hommes américains de 1774. L’écart type de la longueur du pied était \(13,1 mm\) et l’écart type de la largeur du pied était \(5,26 mm\), ce qui donne l’impression que la longueur du pied est plus variable que la largeur du pied. Cependant, les pieds sont plus longs que larges. Diviser par les moyens (\(269,7 mm\) pour la longueur, \(100.,6mm\) pour la largeur), les coefficients de variation sont en fait légèrement plus petits pour la longueur (\(4.9\%\)) que pour la largeur (\(5.2\%\)), ce qui, à la plupart des fins, serait une mesure de variation plus utile.

exemple

Voici les statistiques de dispersion pour les données du naseux à nez noir de la page Web de tendance centrale. En réalité, vous ont rarement une raison de déclarer l’ensemble de ces éléments:

  • Gamme de 90
  • la Variance 1029.5
  • écart-type 32.09
  • Coefficient de variation de 45,8%

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *