A distribuição das médias amostrais representa a população de todas as possíveis médias oriundas de uma amostra de tamanho \(n\) de variável aleatória.
A convergência em forma de distribuição e dos parâmetros dessa distribuição amostral são elucidadas pela Lei dos Grandes Números e pelo Teorema Central do Limite (apresentado no tópico - Teoremas Limites).
De acordo com a teoria e confirmado pelo de simulações conseguimos verificar que a distribuição das médias amostrais resulta em uma distribuição na forma de uma normal, com os seguintes parâmetros:
Seja \(\overline{X}\) uma variável aleatória, \(\overline{X} \sim N(\mu,\sigma^2/n)\).
\[ \begin{aligned} \overline{X} & = \frac{X_1 + ... + X_n}{n}\\ E[\overline{X}] & = \mu \\ V(\overline{X}) & = \frac{\sigma^2}{n}\\ \end{aligned} \]Isso significa dizer que se a população do qual são retidas as amostras segue uma distribuição de probabilidade qualquer a variável aleatória \(\overline{X}\) tenderá à uma distribuição Normal com média \(\mu\) e desvio padrão \(\sigma/\sqrt{n}\) a medida que o \(n\) (tamanho da amostra) aumenta.
Porém se a variável aleatória \(\overline{X}\) for padronizada para \(Z_n\) esta tenderá à uma distribuição normal padrão, com média 0 e desvio padrão 1.
Seja \(Z_n\) uma variável aleatória padronizada, \(Z_n \sim N(0,1)\).
\[ \begin{aligned} Z_n & = \frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\\ E[Z_n] & = 0\\ V(Z_n) & = 1\\ \end{aligned} \]Da mesma forma que o exposto para as médias amostrais, a resultante para a variável aleatória proporção amostral é válida. Porém a v.a. \(\hat{P}\) é oriunda da soma de v.a. Bernoulli, ou seja soma de v.a.s \(X \sim Ber(p)\). Como resultado teremos uma distribuição normal, \(\hat{P} \sim N(p,p(1-p)/n)\)
Seja \(\hat{P}\) uma variável aleatória, \(\hat{P} \sim N(p,p(1-p)/n)\) e \(X \sim Ber(p)\).
\[ \begin{aligned} \hat{P} & = \frac{X_1 + ... + X_n}{n}\\ \quad \\ E[\hat{P}] & = p \\ V(\hat{P}) & = \frac{p(1-p)}{n}\\ \end{aligned} \]Seja \(Z_n\) uma variável aleatória padronizada, \(Z_n \sim N(0,1)\).
\[ \begin{aligned} Z_n & = \frac{\hat{P}-p}{\sqrt{\frac{p(1-p)}{n}}}\\ \quad\\ E[Z_n] & = 0\\ V(Z_n) & = 1\\ \end{aligned} \]Sejam duas populações A e B, para cada uma delas os parâmetros podem ser calculados. Agora suponha que possam ser calculadas as diferenças entre as médias de todas as combinações possíveis de amostras de tamanho \(n_A\) e \(n_B\) das populações A e B.
Assim teremos uma distribuição denominada Distribuição Amostral das Diferenças entre médias (ou proporções). Da mesma forma se aplicam os resultados para a soma destas. Assim temos que
Seja \(\overline{X_A}\) uma variável aleatória, \(\overline{X}_A \sim N(\mu_A,\sigma_A^2/n)\).
Seja \(\overline{X_B}\) uma variável aleatória, \(\overline{X}_B \sim N(\mu_B,\sigma_B^2/n)\).
\[ E[\overline{X}_A] = \mu_A \\ V(\overline{X}_A) = \frac{\sigma_A^2}{n}\\ E[\overline{X}_B] = \mu_B \\ V(\overline{X}_B) = \frac{\sigma_B^2}{n}\\ \] A diferença é dada por:
\[ \begin{aligned} \overline{X}_{AB} & = \overline{X}_A - \overline{X}_B\\ E[\overline{X}_{A-B}] & = \mu_A - \mu_B\\ V(\overline{X}_{A-B}) & = \frac{\sigma_A^2}{n}+\frac{\sigma_B^2}{n}\\ \end{aligned} \] A soma é dada por: \[ \begin{aligned} \overline{X}_{A+B} & = \overline{X}_A + \overline{X}_B\\ E[\overline{X}_{A+B}] & = \mu_A + \mu_B \\ V(\overline{X}_{A+B}) & = \frac{\sigma_A^2}{n}+\frac{\sigma_B^2}{n}\\ \end{aligned} \]Seja \(\hat{P}_A\) uma variável aleatória, \(\hat{P}_A \sim N(p_A,p_A(1-p_A)/n_A)\).
Seja \(\hat{P}_B\) uma variável aleatória, \(\hat{P}_B \sim N(p_B,p_B(1-p_B)/n_B)\).
\[ \begin{aligned} E[\hat{P}_A] & = p_A \\ V(\hat{P}_A) & = \frac{p_A(1-p_A)}{n_A}\\ E[\hat{P}_B] & = p_B \\ V(\hat{P}_B) & = \frac{p_B(1-p_B)}{n_B}\\ \end{aligned} \] A diferença é dada por:
\[ \begin{aligned} \hat{P}_{A-B} & = \hat{P}_A - \hat{P}_B\\ E[\hat{P}_{A-B}] & = p_A - p_B\\ V(\hat{P}_{A-B}) & = \frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}\\ \end{aligned} \] A soma é dada por: \[ \begin{aligned} \hat{P}_{A+B} & = \hat{P}_A + \hat{P}_B\\ E[\hat{P}_{A-B}] & = p_A + p_B\\ V(\hat{P}_{A-B}) & = \frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}\\ \end{aligned} \]Agora que temos a distribuição amostral da média da amostra, vamos voltar nossa atenção para encontrar a distribuição amostral da variância da amostra. O seguinte teorema fará o truque para nós…
Então
\(\overline{X}\) e \(S^2\) são independentes
$ = $
Abaixo está disponível um applet em Java que simula o processo de tomada de amostras de tamanho \(n\) e a criação da distribuição amostral.
Está disponível a simulação da distribuição amostral das seguintes v.a.s:
Este applet java foi desenvolvido por David Lane (Rice University , University of Houston Clear Lake, and Tufts University), no projeto: Online Statistics Education: A Multimedia Course of Study (http://onlinestatbook.com/). Project Leader: David M. Lane, Rice University.