Welcome to Our Website

3.2: Estatísticas de Dispersão


Desvio Padrão

Desvio, embora tenha útil propriedades estatísticas que tornam a base de muitos testes estatísticos, em unidades ao quadrado. Um conjunto de comprimentos medidos em centímetros teria uma variação expressa em centímetros quadrados, o que é estranho; um conjunto de volumes medidos em \(cm^3\) teria uma variação expressa em \(cm^6\), que é ainda mais estranho. Tomar a raiz quadrada da variância dá uma medida de dispersão que está nas unidades originais., A raiz quadrada da variância paramétrica é o desvio padrão paramétrico, que você nunca irá usar; é dada pela função de folha de cálculo STDEVP(Ys). A raiz quadrada da variância da amostra é dada pela função STDEV(Ys) da folha de cálculo. Você deve sempre usar o desvio padrão da amostra; a partir daqui, quando você vê “desvio padrão”, significa o desvio padrão da amostra.

a raiz quadrada da variância da amostra subestima realmente o desvio padrão da amostra um pouco., Gurland e Tripathi (1971) vieram com um fator de correção que dá uma estimativa mais precisa do desvio padrão, mas muito poucas pessoas o usam. Seu fator de correção faz com que o desvio padrão sobre a \(3\%\) maior com um tamanho de amostra de \(9\), e cerca de \(1\%\) maior com um tamanho de amostra de \(25\), por exemplo, e a maioria das pessoas simplesmente não precisam de estimar o desvio-padrão que precisa. Nem SAS nem Excel usa a correção Gurland e Tripathi; eu incluí – a como uma opção em minha planilha de estatísticas descritivas., Se você usar o desvio padrão com a correção Gurland e Tripathi, certifique-se de dizer isso quando você escrever seus resultados.

Fig. 3.2.1 à esquerda: a distribuição teórica normal. Frequências de 5 mil números geradas aleatoriamente para encaixar na distribuição normal. As proporções destes dados dentro de 1, 2, ou 3 desvios padrão da média encaixam muito bem com o esperado a partir da distribuição normal teórica.,
Fig. 3.2.2 esquerda: frequências de 5000 números geradas aleatoriamente para encaixar uma distribuição inclinada para a direita. Frequências de 5 mil números geradas aleatoriamente para encaixar numa distribuição bimodal.

Coeficiente de Variação

Coeficiente de variação é o desvio padrão dividido pela média; ele resume a quantidade de variação em percentagem ou proporção do total., É útil quando se compara a quantidade de variação de uma variável entre grupos com diferentes meios, ou entre diferentes variáveis de medição. Por exemplo, o exército dos Estados Unidos mediu o comprimento do pé e a largura do pé em 1774 homens americanos. O desvio-padrão do comprimento dos pés era \(13,1 mm\) e o desvio-padrão para a largura dos pés era \(5,26 mm\), o que faz parecer que o comprimento dos pés é mais variável do que a largura dos pés. No entanto, os pés são mais longos do que são largos. Dividindo pelos meios [\(269,7 mm\) para o comprimento, \(100.,6mm\) para a largura), os coeficientes de variação são na verdade ligeiramente menores para o comprimento (\(4.9\%\)) do que para a largura (\(5.2\%\)), o que para a maioria dos propósitos seria uma medida de variação mais útil.

exemplo

Aqui estão as estatísticas de dispersão para os dados de negrito da página web de tendência central. Na realidade, você raramente tem alguma razão para relatar todos esses:

  • Intervalo de 90
  • Desvio de 1029.5
  • desvio Padrão 32.09
  • Coeficiente de variação 45.8%

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *