Em muitos casos temos interesse em analisar o comportamento probabilístico de mais de uma variável aleatória. Nestes casos devemos analisar a distribuição conjunta de probabilidades, ou seja, o comportamento simultâneo de probabilidades.
Considere duas variáveis aleatórias discretas \(X\) e \(Y\) com as PMFs \(p_X(x)\) e \(p_Y(y)\) oriundas dos espaços amostrais \(\Omega_{X}\) e \(\Omega_{Y}\). Seja \(\Omega_{X,Y}\) o espaço amostral de todos os possíveis pares observados \((x,y)\), chamado espaço conjunto de \(X\) e \(Y\). A função massa de probabilidade conjunta de \(X\) e \(Y\), \(p_{X,Y}(x,y)\) é definida por:
\[ p_{X,Y}(x,y) = \mathbb{P}(X=x,Y=y) \quad para \space (x,y) \in \Omega_{X,Y} \]
Toda e qualquer PMF conjunta satisfaz,
\[ p_{X,Y}(x,y) \ge 0 \quad para \space (x,y) \in \Omega_{X,Y} \\ \\ \sum\limits_{(x,y) \in \Omega_{X,Y}}{p_{X,Y}(x,y)} = 1\\ \\ \sum\limits_{x}\sum\limits_{x}{p_{X,Y}(x,y)} = 1 \]
Neste contexto vamos nomear as funções massa de probabilidade \(p_X(x)\) e \(p_Y(y)\) como PMF marginal.
\[ p_{X}(x) = \sum\limits_{y}{p_{X,Y}(x,y)}\\ p_{Y}(Y) = \sum\limits_{x}{p_{X,Y}(x,y)}\\ \] Vamos demonstrar essa distribuição a partir de um exemplo simples. Suponha a situação onde duas variáveis aleatórias com respostas discretizadas estão relacionadas, sendo C = clima, T = temperatura, onde \(\Omega_{C} = \{sol, chuva, neve \}\) e \(\Omega_{T}= \{quente, frio\}\), e as probabilidades são dadas a seguir:
C = clima | T = temperatura | Probabilidade conjunta |
---|---|---|
sol | quente | 0.3000000 |
sol | frio | 0.2000000 |
chuva | quente | 0.0333333 |
chuva | frio | 0.1333333 |
neve | quente | 0.0000000 |
neve | frio | 0.3333333 |
Organizando a table a temos o seguinte:
quente | frio | |
---|---|---|
sol | 0.3000000 | 0.2000000 |
chuva | 0.0333333 | 0.1333333 |
neve | 0.0000000 | 0.3333333 |
As probabilidades conjuntas podem ser obtidas como (observe o código):
\[ p_{C,T}("quente","sol") = 0.30 \\ p_{C,T}("frio","chuva") = 0.13 \\ \]
p_CT["sol","quente"]
[1] 0.3
p_CT["chuva","frio"]
[1] 0.1333333
As probabilidades marginais de \(C\) e \(T\) são:
\[ p_{C}(c) = \sum\limits_{t}{p_{C,T}(c,t)}\\ \]
margin.table(p_CT,margin=1)
sol chuva neve
0.5000000 0.1666667 0.3333333
\[ p_{T}(t) = \sum\limits_{c}{p_{C,T}(c,t)}\\ \]
margin.table(p_CT,margin=2)
quente frio
0.3333333 0.6666667
Se \(x \in \Omega_{X}\), tal que \(p_X(x) > 0\), então podemos definir a probabilidade condicional de \(Y|(X = x)\) como \(p_{Y|X}\) sendo,
\[ p_{Y|X} = \frac{p_{X,Y}(x,y)}{p_{X}(x)} \quad y \in \Omega_{Y} \]
Este conteúdo está disponível por meio da Licença Creative Commons 4.0