standaardafwijking
variantie, hoewel het nuttige statistische eigenschappen heeft die het de basis maken van vele statistische tests, is in kwadraateenheden. Een set lengtes gemeten in centimeters zou een variantie uitgedrukt in vierkante centimeters hebben, wat gewoon raar is; een set volumes gemeten in \(cm^3\) zou een variantie uitgedrukt in \(cm^6\) hebben, wat nog vreemder is. Het nemen van de vierkantswortel van de variantie geeft een mate van verspreiding die in de oorspronkelijke eenheden., De vierkantswortel van de parametrische variantie is de parametrische standaarddeviatie, die u nooit zult gebruiken; wordt gegeven door de spreadsheet functie STDEVP(Ys). De vierkantswortel van de steekproefvariantie wordt gegeven door de spreadsheetfunctie STDEV(Ys). U moet altijd de standaarddeviatie van het monster gebruiken; vanaf hier, wanneer u “standaarddeviatie” ziet, betekent dit de standaarddeviatie van het monster.
de vierkantswortel van de steekproefvariantie onderschat eigenlijk de standaarddeviatie van het monster met een beetje., Gurland en Tripathi (1971) kwamen met een correctiefactor die een nauwkeurigere schatting van de standaardafwijking geeft, maar zeer weinig mensen gebruiken deze. Hun correctiefactor maakt de standaardafwijking ongeveer \(3\%\) groter bij een steekproefgrootte van \(9\), en ongeveer \(1\%\) groter bij een steekproefgrootte van \(25\), bijvoorbeeld, en de meeste mensen hoeven de standaardafwijking gewoon niet zo nauwkeurig in te schatten. Noch Sas noch Excel maakt gebruik van de Gurland en Tripathi correctie; ik heb opgenomen als een optie in mijn beschrijvende statistieken spreadsheet., Als u de standaarddeviatie gebruikt met de Gurland en Tripathi correctie, moet u dit zeker zeggen wanneer u uw resultaten opschrijft.
variatiecoëfficiënt
variatiecoëfficiënt is de standaardafwijking gedeeld door het gemiddelde; het vat de variatiehoeveelheid samen als percentage of percentage van het totaal., Het is nuttig bij het vergelijken van de hoeveelheid variatie voor een variabele tussen groepen met verschillende middelen, of tussen verschillende meetvariabelen. Bijvoorbeeld, het leger van de Verenigde Staten gemeten voet lengte en voetbreedte in 1774 Amerikaanse mannen. De standaarddeviatie van voetlengte was \(13.1 mm\) en de standaarddeviatie voor voetbreedte was \(5.26 mm\), waardoor het lijkt alsof voetlengte variabeler is dan voetbreedte. Echter, voeten zijn langer dan ze breed zijn. Delen door de middelen (\(269.7 mm\) voor lengte, \(100.,6mm\) voor breedte) zijn de variatiecoëfficiënten eigenlijk iets kleiner voor lengte (\(4.9\%\)) dan voor breedte (\(5.2\%\)), wat voor de meeste doeleinden een nuttiger maat voor variatie zou zijn.
voorbeeld
Hier zijn de verspreidingsstatistieken voor de blacknose dace-gegevens van de centrale tendency webpagina. In werkelijkheid zou u zelden een reden hebben om al deze gegevens te rapporteren:
- Range 90
- variantie 1029.5
- standaardafwijking 32.09
- variatiecoëfficiënt 45,8%