Welcome to Our Website

3.2: statistik över spridning

standardavvikelse

varians, medan den har användbara statistiska egenskaper som gör den till grund för många statistiska tester, finns i kvadrerade enheter. En uppsättning längder uppmätta i centimeter skulle ha en varians uttryckt i kvadratcentimeter, vilket bara är konstigt; en uppsättning volymer uppmätta i \(cm^3\) skulle ha en varians uttryckt i \(cm^6\), vilket är ännu konstigare. Att ta kvadratroten av variansen ger ett mått på spridning som finns i de ursprungliga enheterna., Kvadratroten av parametrisk varians är den parametriska standardavvikelsen, som du aldrig kommer att använda; ges av kalkylbladsfunktionen STDEVP (Ys). Kvadratroten av provvariansen ges av kalkylbladsfunktionen STDEV (Ys). Du bör alltid använda prov standardavvikelsen; härifrån, när du ser ”standardavvikelse” betyder det prov standardavvikelsen.

kvadratroten av provvariansen underskattar faktiskt provstandardavvikelsen med lite., Gurland och Tripathi (1971) kom upp med en korrigeringsfaktor som ger en mer exakt uppskattning av standardavvikelsen, men väldigt få personer använder den. Deras korrektionsfaktor gör standardavvikelsen om \(3\%\) större med en provstorlek på \(9\) och om \(1\%\) större med en provstorlek på \(25\), till exempel, och de flesta behöver bara inte uppskatta standardavvikelsen som exakt. Varken SAS eller Excel använder Gurland och Tripathi korrigering, jag har tagit det som ett alternativ i mitt beskrivande statistik kalkylblad., Om du använder standardavvikelsen med Gurland och Tripathi-korrigeringen, var noga med att säga detta när du skriver upp dina resultat.

Fig. 3.2.1 vänster: den teoretiska normala fördelningen. Höger: frekvenser på 5000 nummer slumpmässigt genererade för att passa den normala fördelningen. Proportionerna av dessa data inom 1, 2 eller 3 standardavvikelser av medelvärdet passar ganska snyggt till det som förväntas från den teoretiska normala fördelningen.,
Fig. 3.2.2 vänster: frekvenser på 5000 nummer slumpmässigt genererade för att passa en fördelning skev till höger. Höger: frekvenser på 5000 nummer slumpmässigt genererade för att passa en bimodal distribution.

variationskoefficient

variationskoefficient är standardavvikelsen dividerad med medelvärdet; det sammanfattar variationsmängden som en procentandel eller andel av den totala., Det är användbart när man jämför variationsmängden för en variabel mellan grupper med olika medel eller mellan olika mätvariabler. Till exempel mätte USA: s militära fotlängd och fotbredd i 1774 amerikanska män. Standardavvikelsen för fotlängd var \(13.1 mm\) och standardavvikelsen för fotbredd var \(5.26 mm\), vilket gör att det verkar som om fotlängden är mer variabel än fotbredd. Fötterna är dock längre än de är breda. Dividera med medel (\(269.7 mm\) För längd, \(100.,6mm\) för bredd) är variationskoefficienterna faktiskt något mindre för Längd (\(4.9\%\) än för bredd (\(5.2\%\)), vilket för de flesta ändamål skulle vara ett mer användbart mått på variation.

exempel

här är statistiken över dispersion för blacknose dace-data från den centrala tendensens webbsida. I verkligheten skulle du sällan ha någon anledning att rapportera alla dessa:

  • intervall 90
  • varians 1029.5
  • standardavvikelse 32.09
  • variationskoefficient 45.8%

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *