Welcome to Our Website

3.2: statistik over Dispersion


standardafvigelse

varians, mens den har nyttige statistiske egenskaber, der gør det til grundlaget for mange statistiske tests, er i kvadrerede enheder. Et sæt længder målt i centimeter ville have en varians udtrykt i kvadratcentimeter, hvilket er bare underligt; et sæt volumener målt i \(cm^3\) ville have en varians udtrykt i \(cm^6\), hvilket er endnu mere underligt. At tage kvadratroden af variansen giver et mål for spredning, der er i de oprindelige enheder., Kvadratroden af den parametriske varians er den parametriske standardafvigelse, som du aldrig vil bruge; er givet af regnearkfunktionen STDEVP(Ys). Kvadratroden af prøvevariansen er givet af regnearkfunktionen STDEV (Ys). Du bør altid bruge prøven standardafvigelse; herfra på, når du ser “standardafvigelse,” det betyder prøven standardafvigelse.

kvadratroden af prøvevariansen undervurderer faktisk prøvens standardafvigelse med en lille smule., Gurland og Tripathi (1971) kom op med en korrektionsfaktor, der giver et mere præcist skøn over standardafvigelsen, men meget få mennesker bruger det. Deres korrektionsfaktor gør standardafvigelsen omkring \(3\%\) større med en prøvestørrelse på \(9\) og omkring \(1\%\) større med en prøvestørrelse på \(25\), for eksempel, og de fleste mennesker behøver bare ikke at estimere standardafvigelse nøjagtigt. Hverken SAS eller Excel bruger Gurland og Tripathi korrektion; jeg har medtaget det som en mulighed i min beskrivende statistik regneark., Hvis du bruger standardafvigelsen med gurland-og Tripathi-korrektionen, skal du sørge for at sige dette, når du skriver dine resultater.

Fig. 3.2.1 til venstre: den teoretiske normale fordeling. Højre: frekvenser på 5.000 tal genereres tilfældigt for at passe til den normale fordeling. Proportionerne af disse data inden for 1, 2 eller 3 standardafvigelser af middelværdien passer ganske pænt til det, der forventes fra den teoretiske normale fordeling.,
Fig. 3.2.2 venstre: frekvenser på 5.000 numre tilfældigt genereret til at passe en fordeling skæv til højre. Til højre: frekvenser på 5.000 tal genereres tilfældigt for at passe til en bimodal distribution.

variationskoefficient

variationskoefficient er standardafvigelsen divideret med gennemsnittet; det sammenfatter mængden af variation som en procentsats eller en andel af det samlede., Det er nyttigt, når man sammenligner mængden af variation for en variabel blandt grupper med forskellige midler eller blandt forskellige målevariabler. For eksempel målte USA ‘ s militær fodlængde og Fodbredde i 1774 amerikanske mænd. Standardafvigelsen for fodlængden var \(13.1 mm\), og standardafvigelsen for Fodbredde var \(5.26 mm\), hvilket får det til at virke som om fodlængden er mere variabel end fodbredden. Fødderne er dog længere, end de er brede. Dividere med midlerne (\(269,7 mm\) for længde, \(100.,6mm\) for bredde) er variationskoefficienterne faktisk lidt mindre for længde (\(4.9\%\)) end for bredde (\(5.2\%\)), hvilket for de fleste formål ville være et mere nyttigt mål for variation.

eksempel

Her er statistikken over dispersion for blacknose dace data fra den centrale tendens webebside. I virkeligheden, du vil sjældent have nogen grund til at rapportere alle af disse:

  • Vifte 90
  • Varians 1029.5
  • Standard afvigelse 32.09
  • variationskoefficient 45.8%

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *