Capítulo 6 Medidas de variação
As medidas de variação indicam o grau de dispersão das observações. Distribuições com observações muito próximas à média têm baixo grau de dispersão, enquanto aquelas com observações muito distantes da média têm alto grau de dispersão. Vamos apresentar quatro índices que medem o grau de dispersão: a variância, o desvio padrão, o coeficiente de variação e a amplitude de variação.
6.1 Variância
A variância descrita pelo símbolo \(s^2\) mede quão distante as observações em uma variável estão de sua média aritmética. O \(s^2\) se refere à variância amostral. Na seção sobre inferência estatística (Capítulos 13 a 18) faremos distinção com o conceito de variância populacional (\(\sigma^2\)).
Para um conjunto de \(n\) observações, a variância amostral é dada por:
\[s^2=\frac{\sum_{i=1}^n{(X_i - \overline{X})^2}}{n-1}\]
Seja a variável \(X\) com 5 observações:
\(X =\) {9, 4, 7, 1, 2}
Para calcularmos a variância devemos inicialmente, obter a média de \(X\), que neste caso é:
\(\overline{X} = 4.6\)
E subtrair cada observação da média:
X | \(X - \overline{X}\) |
---|---|
9 | 4.4 |
4 | -0.6 |
7 | 2.4 |
1 | -3.6 |
2 | -2.6 |
Em seguida, elevamos cada a diferença ao quadrado:
X | \(X - \overline{X}\) | \({(X - \overline{X})}^{2}\) |
---|---|---|
9 | 4.4 | 19.36 |
4 | -0.6 | 0.36 |
7 | 2.4 | 5.76 |
1 | -3.6 | 12.96 |
2 | -2.6 | 6.76 |
Somamos esta quantia e dividimos por \(n - 1\)
\(s^2 = \frac{19.36 + 0.36 + 5.76 + 12.96 + 6.76}{5 - 1} = \frac{45.2}{4} = 11.3\)
6.2 Desvio padrão
O desvio padrão (\(s\)) é simplesmente a raiz quadrada da variância.
\[s=\sqrt{\frac{\sum_{i=1}^n{(X_i - \overline{X})^2}}{n-1}}\]
E em nosso exemplo:
\(s = \sqrt{11.3} = 3.36\)
6.3 Coeficiente de variação
O coeficiente de variação (cv) relaciona o desvio padrão à média, sendo definido por:
\[cv = s/\overline{X}\] ou \[cv_{\%} = s/\overline{X}\cdot 100\]
Em nosso exemplo:
\(cv = \frac{3.36}{4.6} \cdot 100 = 73.08\)
6.4 Amplitude de variação
É a diferença entre os pontos máximo e mínimo de um grupo de observações
Amplitude de variação = \(X_{maximo} - X_{minimo}\)
que em nosso exemplo é
Amplitude de variação = \(9 - 1 = 8\)
IMPORTANTE!
Nas seções sobre Amostragem e Delineamento e Inferência e Teste de Hipóteses (Capítulos 12 a 18) faremos distinção entre variância e desvio padrão amostral (respectivamente \(s^{2}\) e \(s\)) e a variância e desvio padrão populacional (respectivamente \(\sigma^{2}\) e \(\sigma\)).
6.5 Obtendo medidas variação de uma tabela de dados
Carregue o pacote tidyverse
e importe novamente a base de dados Reservatorios_Parana_parcial.csv
.
# Carrega pacotes
library(tidyverse)
# Importa base de dados
= read_delim('Reservatorios_Parana_parcial.csv',
res delim = ',',
locale = locale(decimal_mark = '.',
encoding = 'latin1'))
Assim como fizemos no capítulo 5 usaremos a função summarise
para obter descritores de variação para a variável CPUE
.
%>%
res summarise(CPUE_var = var(CPUE),
CPUE_dp = sd(CPUE),
CPUE_cv = sd(CPUE)/mean(CPUE) * 100,
CPUE_amplutide = max(CPUE) - min(CPUE))
CPUE_var | CPUE_dp | CPUE_cv | CPUE_amplutide |
---|---|---|---|
54.31838 | 7.3701 | 58.02786 | 28.71 |