Welcome to Our Website

3.2: Statistiky Rozptyl


Směrodatná Odchylka

Rozptyl, zatímco to má užitečné statistické vlastnosti, které je základem mnoha statistických testů, je v jednotky na druhou. Sada délky měřené v centimetrech bude mít rozptyl vyjádřený ve čtverečních centimetrů, což je prostě divné; sada svazků měří v \(cm^3\) bude mít rozptyl vyjádřený v \(cm^6\), což je ještě divnější. Užívání druhé odmocniny rozptylu dává míru disperze, která je v původních jednotkách., Druhá odmocnina parametrické odchylky je parametrická směrodatná odchylka, kterou nikdy nepoužijete; je dána tabulkovou funkcí STDEVP (Ys). Druhá odmocnina rozptylu vzorku je dána tabulkovou funkcí STDEV (Ys). Vždy byste měli použít směrodatnou odchylku vzorku; odtud, Když vidíte „směrodatnou odchylku“, znamená to směrodatnou odchylku vzorku.

druhá odmocnina rozptylu vzorku ve skutečnosti podceňuje směrodatnou odchylku vzorku o trochu., Gurland a Tripathi (1971) přišli s korekčním faktorem, který poskytuje přesnější odhad standardní odchylky, ale jen velmi málo lidí ji používá. Jejich korekční faktor je směrodatná odchylka o \(3\%\) větší vzorek velikost \(9\), a o \(1\%\) větší vzorek velikost \(25\), například, a většina lidí prostě není potřeba pro odhad směrodatné odchylky, které přesně. Ani SAS ani Excel nepoužívá opravu Gurland a Tripathi; zahrnul jsem ji jako možnost do tabulky popisných statistik., Používáte-li směrodatnou odchylku s korekcí Gurland a Tripathi, nezapomeňte to říci, když zapíšete své výsledky.

Obr. 3.2.1 vlevo: teoretická normální distribuce. Právo: frekvence 5000 čísel náhodně generovaných tak, aby odpovídaly normálnímu rozdělení. Proporce těchto údajů v rozmezí 1, 2 nebo 3 směrodatných odchylek průměru se docela dobře hodí k tomu, co se očekává od teoretického normálního rozdělení.,
Obr. 3.2.2 vlevo: frekvence 5000 čísel náhodně generovaných, aby se vešly rozdělení zkosené doprava. Vpravo: frekvence 5000 čísel náhodně generovaných tak, aby odpovídaly bimodální distribuci.

Variační Koeficient

variační Koeficient je směrodatná odchylka dělená střední; to shrnuje množství variací jako procento nebo podíl z celkového počtu., To je užitečné při porovnávání množství variace pro jednu proměnnou mezi skupinami s různými prostředky, nebo mezi různými proměnnými měření. Například armáda Spojených států měřila délku nohou a šířku nohou u 1774 amerických mužů. Standardní odchylka délky nohy byla \(13.1 mm\) a standardní odchylka pro šířku nohy byla \(5.26 mm\), což způsobuje, že se zdá, jako by délka nohy byla proměnlivější než šířka nohy. Nohy jsou však delší, než jsou široké. Dělení prostředky (\(269,7 mm\) na délku, \(100.,6mm\) pro šířku), variační koeficienty jsou ve skutečnosti o něco menší pro délku (\(4.9\%\)) než pro šířku (\(5.2\%\)), což by pro většinu účelů bylo užitečnějším měřítkem variace.

příklad

zde jsou statistiky disperze dat blacknose dace z webové stránky central tendence. Ve skutečnosti by jen zřídka mají nějaký důvod hlásit všechny z nich:

  • Rozsah 90
  • Rozptyl 1029.5
  • Standardní odchylka 32.09
  • variační Koeficient 45.8%

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *