Welcome to Our Website

3.2: Statistik der Dispersion


Standardabweichung

Varianz, während es nützliche statistische Eigenschaften hat, die es zur Grundlage vieler statistischer Tests machen, ist in quadratischen Einheiten. Eine Menge von Längen, die in Zentimetern gemessen werden, hätte eine Varianz in Quadratzentimetern, was nur seltsam ist; Eine Menge von Volumina, die in \(cm^3\) gemessen werden, hätte eine Varianz, die in \(cm^6\) ausgedrückt wird, was noch seltsamer ist. Die Quadratwurzel der Varianz ergibt ein Maß für die Streuung, das in den ursprünglichen Einheiten liegt., Die Quadratwurzel der parametrischen Varianz ist die parametrische Standardabweichung, die Sie niemals verwenden werden.wird durch die Tabellenkalkulationsfunktion STDEVP(Ys) gegeben. Die Quadratwurzel der Stichprobenvarianz wird durch die Tabellenkalkulationsfunktion STDEV(Ys) angegeben. Sie sollten immer die Stichprobenstandardabweichung verwenden; von hier an, wenn Sie „Standardabweichung“ sehen, bedeutet dies die Stichprobenstandardabweichung.

Die Quadratwurzel der Stichprobenvarianz unterschätzt die Stichprobenstandardabweichung tatsächlich um ein wenig., Gurland und Tripathi (1971) entwickelten einen Korrekturfaktor, der eine genauere Schätzung der Standardabweichung liefert, aber nur sehr wenige Menschen verwenden ihn. Ihr Korrekturfaktor macht die Standardabweichung ungefähr \(3\%\) größer mit einer Stichprobengröße von \(9\) und ungefähr \(1\%\) größer mit einer Stichprobengröße von \(25\), zum Beispiel, und die meisten Leute müssen einfach nicht die Standardabweichung so genau schätzen. Weder SAS noch Excel verwenden die Gurland-und Tripathi-Korrektur; Ich habe sie als Option in meine beschreibende Statistiktabelle aufgenommen., Wenn Sie die Standardabweichung mit der Gurland-und Tripathi-Korrektur verwenden, sagen Sie dies unbedingt, wenn Sie Ihre Ergebnisse aufschreiben.

Abb. 3.2.1 Links: Die theoretische Normalverteilung. Rechts: Frequenzen von 5.000 Zahlen, die zufällig generiert wurden, um der Normalverteilung zu entsprechen. Die Proportionen dieser Daten innerhalb von 1, 2 oder 3 Standardabweichungen vom Mittelwert passen ganz gut zu, dass die erwartete von der theoretischen Normalverteilung.,
Abb. 3.2.2 Links: Frequenzen von 5.000 Zahlen zufällig generiert, um eine Verteilung nach rechts verzerrt passen. Rechts: Frequenzen von 5.000 Zahlen, die zufällig generiert wurden, um einer bimodalen Verteilung zu entsprechen.

Variationskoeffizient

Variationskoeffizient ist die Standardabweichung geteilt durch den Mittelwert; er fasst den Variationskoeffizienten als Prozentsatz oder Anteil der Gesamtmenge zusammen., Dies ist nützlich, wenn der Variationsgrad für eine Variable zwischen Gruppen mit unterschiedlichen Mitteln oder zwischen verschiedenen Messvariablen verglichen wird. Zum Beispiel maß das US-Militär Fußlänge und Fußbreite in 1774 amerikanischen Männern. Die Standardabweichung der Fußlänge betrug \(13.1 mm\) und die Standardabweichung für die Fußbreite betrug \(5.26 mm\), was den Anschein erweckt, als ob die Fußlänge variabler als die Fußbreite wäre. Die Füße sind jedoch länger als breit. Dividieren durch die Mittel (\(269,7 mm\) für die Länge, \(100.,6mm\) für breite), die variationskoeffizienten ist tatsächlich etwas kleiner für länge (\(4,9\%\)) als für breite (\(5.2\%\)), was für die meisten Zwecke ein nützlicheres Maß für die Variation wäre.

Beispiel

Hier sind die Streuungsstatistiken für die Blacknose dace-Daten von der central tendency-Webseite. In Wirklichkeit hätten Sie selten einen Grund, all dies zu melden:

  • Bereich 90
  • Varianz 1029.5
  • Standardabweichung 32.09
  • Variationskoeffizient 45.8%

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.