Capítulo 6 Medidas de variação

As medidas de variação indicam o grau de dispersão das observações. Distribuições com observações muito próximas à média têm baixo grau de dispersão, enquanto aquelas com observações muito distantes da média têm alto grau de dispersão. Vamos apresentar quatro índices que medem o grau de dispersão: a variância, o desvio padrão, o coeficiente de variação e a amplitude de variação.

6.1 Variância

A variância descrita pelo símbolo \(s^2\) mede quão distante as observações em uma variável estão de sua média aritmética. O \(s^2\) se refere à variância amostral. Na seção sobre inferência estatística (Capítulos 13 a 18) faremos distinção com o conceito de variância populacional (\(\sigma^2\)).

Para um conjunto de \(n\) observações, a variância amostral é dada por:

\[s^2=\frac{\sum_{i=1}^n{(X_i - \overline{X})^2}}{n-1}\]

Seja a variável \(X\) com 5 observações:

\(X =\) {9, 4, 7, 1, 2}

Para calcularmos a variância devemos inicialmente, obter a média de \(X\), que neste caso é:

\(\overline{X} = 4.6\)

E subtrair cada observação da média:

X \(X - \overline{X}\)
9 4.4
4 -0.6
7 2.4
1 -3.6
2 -2.6

Em seguida, elevamos cada a diferença ao quadrado:

X \(X - \overline{X}\) \({(X - \overline{X})}^{2}\)
9 4.4 19.36
4 -0.6 0.36
7 2.4 5.76
1 -3.6 12.96
2 -2.6 6.76

Somamos esta quantia e dividimos por \(n - 1\)

\(s^2 = \frac{19.36 + 0.36 + 5.76 + 12.96 + 6.76}{5 - 1} = \frac{45.2}{4} = 11.3\)

6.2 Desvio padrão

O desvio padrão (\(s\)) é simplesmente a raiz quadrada da variância.

\[s=\sqrt{\frac{\sum_{i=1}^n{(X_i - \overline{X})^2}}{n-1}}\]

E em nosso exemplo:

\(s = \sqrt{11.3} = 3.36\)

6.3 Coeficiente de variação

O coeficiente de variação (cv) relaciona o desvio padrão à média, sendo definido por:

\[cv = s/\overline{X}\] ou \[cv_{\%} = s/\overline{X}\cdot 100\]

Em nosso exemplo:

\(cv = \frac{3.36}{4.6} \cdot 100 = 73.08\)

6.4 Amplitude de variação

É a diferença entre os pontos máximo e mínimo de um grupo de observações

Amplitude de variação = \(X_{maximo} - X_{minimo}\)

que em nosso exemplo é

Amplitude de variação = \(9 - 1 = 8\)



IMPORTANTE!

Nas seções sobre Amostragem e Delineamento e Inferência e Teste de Hipóteses (Capítulos 12 a 18) faremos distinção entre variância e desvio padrão amostral (respectivamente \(s^{2}\) e \(s\)) e a variância e desvio padrão populacional (respectivamente \(\sigma^{2}\) e \(\sigma\)).



6.5 Obtendo medidas variação de uma tabela de dados

Carregue o pacote tidyverse e importe novamente a base de dados Reservatorios_Parana_parcial.csv.

# Carrega pacotes
library(tidyverse)
# Importa base de dados 
res = read_delim('Reservatorios_Parana_parcial.csv',
                  delim = ',',
                  locale = locale(decimal_mark = '.',
                                  encoding = 'latin1'))

Assim como fizemos no capítulo 5 usaremos a função summarise para obter descritores de variação para a variável CPUE.

res %>% 
  summarise(CPUE_var = var(CPUE),
            CPUE_dp = sd(CPUE),
            CPUE_cv = sd(CPUE)/mean(CPUE) * 100,
            CPUE_amplutide = max(CPUE) - min(CPUE))
CPUE_var CPUE_dp CPUE_cv CPUE_amplutide
54.31838 7.3701 58.02786 28.71