✅ Modelos probabilísticos para variáveis discretas e contáveis: número de sucessos em $n$ ensaios, contagem de ocorrências
✅ Para cada valor $k$, existe uma probabilidade $P(X = k)$: $$P(X = k) = \binom{n}{k}\, p^k\,(1-p)^{n-k}$$
✅ A soma sobre todos os valores possíveis é exatamente 1
✅ Aproximação por grade: obtendo a distribuição a posteriori por simulação numérica
Em uma escala contínua, a probabilidade de qualquer valor pontual exato é zero. A ferramenta adequada é a função densidade de probabilidade.
pnorm() e qnorm()Para variáveis aleatórias discretas, a função massa de probabilidade (FMP) atribui uma probabilidade a cada valor possível.
Para o número de sucessos em $n$ ensaios com probabilidade $p$:
Se $X$ é a altura de um adulto escolhido ao acaso, qual é $P(X = 168{,}3 \text{ cm})$?
A quantidade relevante passa a ser a probabilidade de um intervalo:
$$P(a \leq X \leq b)$$A ferramenta que organiza essa informação é a função densidade de probabilidade (FDP), denotada $f(x)$.
A probabilidade de $X$ pertencer ao intervalo $[a, b]$ é a área sob a curva entre $a$ e $b$:
$$P(a \leq X \leq b) = \int_a^b f(x)\, dx$$A probabilidade está sempre na área sob a curva, nunca na altura pontual da curva.
Como consequência, $f(x)$ pode ser maior do que 1.
Exemplo: Distribuição Normal com $\mu = 0$ e $\sigma = 0{,}1$:
dnorm(0, mean = 0, sd = 0.1)
# [1] 3.989423
O valor 3,99 não viola nenhuma propriedade. A área total sob essa curva estreita e alta ainda integra para 1. A probabilidade está sempre na área, nunca na altura pontual.
Uma Distribuição Normal com $\mu = 160$ e $\sigma = 10$ atribui probabilidade zero ao valor exato $x = 160$. Como então a distribuição pode ter sua maior "concentração" exatamente em 160?
(A) A afirmação está errada: $P(X = 160) > 0$ em distribuições contínuas
(B) A densidade $f(160)$ é máxima nesse ponto, mesmo que a probabilidade pontual seja zero
(C) $\mu = 160$ é o único valor possível quando $\sigma = 10$
(D) A área sob a curva em $x = 160$ é finita e positiva
Uma candidata natural para descrever uma curva simétrica em formato de sino é a função com expoente quadrático negativo:
Para deslocar o centro para $\mu$ e controlar a abertura com $\sigma$, substitui-se $x$ por $(x - \mu)/\sigma$:
O denominador $2\sigma^2$ regula a velocidade de decaimento. A constante $1/(\sigma\sqrt{2\pi})$ garante que a área total seja 1.
Notação padrão: $X \sim \text{Normal}(\mu,\, \sigma)$
Os parâmetros $\mu$ e $\sigma$ determinam completamente a forma e a posição da curva.
Aumentar $\sigma$ espalha a probabilidade por uma faixa mais ampla sem alterar a probabilidade total.
| Intervalo | Probabilidade aproximada |
|---|---|
| $[\mu - \sigma,\; \mu + \sigma]$ | 68% |
| $[\mu - 2\sigma,\; \mu + 2\sigma]$ | 95% |
| $[\mu - 3\sigma,\; \mu + 3\sigma]$ | 99,7% |
Se $X \sim \text{Normal}(160, 10)$: aproximadamente 95% das observações esperadas estão no intervalo $[140, 180]$. Valores fora de $[130, 190]$ são raros, com menos de 0,3% de probabilidade.
pnorm(), qnorm() e as quatro funções em Rpnorm()A probabilidade de $X$ estar no intervalo $[a, b]$ é a área sob a curva entre $a$ e $b$.
A função pnorm(q, mean, sd) calcula a probabilidade acumulada $P(X \leq q)$:
pnorm(40, mean = 30, sd = 5) - pnorm(25, mean = 30, sd = 5)
# [1] 0.8185946
Exemplo 2. Probabilidade de comprimento acima de 38 cm:
1 - pnorm(38, mean = 30, sd = 5)
# [1] 0.05479929
qnorm()A função qnorm(p, mean, sd) resolve o problema inverso: dado $P(X \leq q) = p$, qual o valor de $q$?
qnorm(0.90, mean = 30, sd = 5)
# [1] 36.40776
90% dos peixes têm comprimento inferior a 36,4 cm nesse modelo.
| Função | Descrição | Responde a |
|---|---|---|
dnorm(x, mean, sd) |
Densidade $f(x)$ no ponto $x$ | Qual a densidade em $x$? |
pnorm(q, mean, sd) |
Probabilidade acumulada $P(X \leq q)$ | Qual a probabilidade até $q$? |
qnorm(p, mean, sd) |
Quantil $q$ tal que $P(X \leq q) = p$ | Qual o valor para $P = p$? |
rnorm(n, mean, sd) |
Gera $n$ amostras aleatórias | Como simular $n$ valores? |
dnorm retorna densidade (pode ser maior que 1). pnorm retorna probabilidade (sempre entre 0 e 1).
A distribuição de alturas de adultos em uma população apresenta um padrão reconhecível:
height (cm), weight (kg), age (anos), male (1/0)A Distribuição Normal é o modelo probabilístico padrão para variáveis biológicas simétricas como a altura corporal.
$\mu$: altura média na população (desconhecida)
$\sigma$: variabilidade típica das alturas ao redor de $\mu$ (desconhecida)
Na abordagem bayesiana, os parâmetros $\mu$ e $\sigma$ são variáveis aleatórias com suas próprias distribuições de probabilidade.
Cobre aproximadamente $[120,\, 200]$ cm (±2$\sigma_0$)
Permite valores fora dessa faixa
Concentra a probabilidade onde alturas médias adultas são biologicamente razoáveis
Suporte em $(0,\, +\infty)$: garante $\sigma > 0$
Média: $1/0{,}1$ = 10 cm
Cauda longa: permite variabilidade maior se os dados exigirem
Concentra a probabilidade entre 0 e 30 cm
Esse conjunto de equações define um modelo generativo: especificado completamente, ele pode gerar dados simulados com a mesma estrutura probabilística que os dados reais são esperados seguir.
As distribuições a priori para $\mu$ e $\sigma$ representam o que o modelo "sabe" antes de ver qualquer observação.
A distribuição preditiva a priori é a distribuição dos valores de $Y$ que o modelo espera gerar antes de observar qualquer dado.
Essa integral não precisa ser calculada analiticamente. O mesmo resultado se obtém por simulação em três passos.
Interpretação: "Se minhas distribuições a priori para $\mu$ e $\sigma$ estão corretas, que alturas devo esperar observar?"
set.seed(2026)
N <- 2000
mu_sim <- rnorm(N, mean = 160, sd = 20) # Passo 1
sigma_sim <- rexp(N, rate = 0.1) # Passo 2
y_sim <- rnorm(N, mean = mu_sim,
sd = sigma_sim) # Passo 3
hist(y_sim, freq = FALSE, breaks = 50,
xlab = "Altura simulada (cm)", ylab = "Densidade",
main = "Distribuição preditiva a priori — alturas")
Verificações úteis ao analisar o histograma:
Se a distribuição preditiva a priori contiver muitas alturas biologicamente impossíveis, as distribuições a priori para $\mu$ e $\sigma$ precisam ser revisadas antes de ajustar o modelo aos dados.
# Comparacao: priori mais dispersa para mu
mu_sim_amplo <- rnorm(N, mean = 160, sd = 100)
y_sim_amplo <- rnorm(N, mean = mu_sim_amplo,
sd = sigma_sim)
| Tema | Conceito central | Ferramenta em R |
|---|---|---|
| FDP | $P(a \leq X \leq b) = \int_a^b f(x)\, dx$; $f(x)$ pode ser maior que 1 | dnorm(x) |
| Dist. Normal | $X \sim \text{Normal}(\mu, \sigma)$: $\mu$ = localização, $\sigma$ = dispersão | dnorm, pnorm, qnorm, rnorm |
| Regra 68-95-99.7 | ±1$\sigma$: 68%; ±2$\sigma$: 95%; ±3$\sigma$: 99,7% | pnorm(μ ± kσ) - pnorm(μ - kσ) |
| Modelo bayesiano | $Y \sim \text{Normal}(\mu, \sigma)$; priori para $\mu$ e $\sigma$ | rnorm, rexp |
| Dist. preditiva a priori | Predições antes dos dados: verificação das distribuições a priori | rnorm(N, mu_sim, sigma_sim) |