조건부분산
덤프버전 :
1. 개요[편집]
Conditional Variance
조건부 확률분포를 이용하여 조건부 분산을 정의할 수 있다.
2. 정의[편집]
이산 확률 변수
X와 Y가 이산 확률 변수인 경우 X가 주어진 경우 Y의 조건부 분산은 다음과 같이 정의된다.
[math(
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \displaystyle\sum_y y^2P(Y=y|X=x) - (\displaystyle\sum_y yP(Y=y|X=x))^2
\end{aligned}
)]
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \displaystyle\sum_y y^2P(Y=y|X=x) - (\displaystyle\sum_y yP(Y=y|X=x))^2
\end{aligned}
)]
연속 확률 변수
X와 Y가 연속 확률 변수이며, [math(f_{X,Y}(x,y))] 가 X 와 Y 의 결합 분포 이며, [math(f_X(x))] 가 X의 확률 밀도 함수 이면, X 가 주어진 경우 Y의 조건부 분산은 다음과 같이 정의된다.
[math(
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \int y^2 \frac{f_{X,Y}(x,y)}{f_X(x)}dy - (\int y \frac{f_{X,Y}(x,y)}{f_X(x)}dy)^2\\
&= \int y^2 f_{Y|X}(y|x)dy - [\int y f_{Y|X}(y|x)dy]^2
\end{aligned}
)]
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \int y^2 \frac{f_{X,Y}(x,y)}{f_X(x)}dy - (\int y \frac{f_{X,Y}(x,y)}{f_X(x)}dy)^2\\
&= \int y^2 f_{Y|X}(y|x)dy - [\int y f_{Y|X}(y|x)dy]^2
\end{aligned}
)]
[math(E[Y | X = x])] 는 X가 주어진 경우 Y의 조건부기댓값 이다.
주의할점은, [math(Var[Y | X = x])] 는 [math(X = x)] 가 주어진 경우 Y의 조건부 분산이나 [math(Var[Y | X])] 는 X 가 어떤값을 무작위로 가질때 Y의 조건부 분산을 나타내는 확률 변수이다.
3. 성질[편집]
분산이 가지고 있는 모든 성질을 가지고 있다.
부가적으로, X 와 Y 가 확률변수일 경우 아래의 성질이 성립한다.
[math(Var[Y] = E[Var[Y | X]] + Var[E[Y | X]])] 전체 분산의 법칙 또는 반복 분산의 법칙 이라 불린다.
[ 증명 ] - [math(
\begin{aligned}
Var[Y] &= E[Y^2] - E[Y]^2\\
&= E[E[Y^2 | X]] - E[E[Y|X]]^2\\
&= E[Var[Y | X] + E[Y | X]^2] - E[E[Y|X]]^2\\
&= E[Var[Y | X]] + E[E[Y | X]^2] - E[E[Y | X]]^2\\
&= E[Var[Y | X]] + Var[E[Y|X]] \quad\quad \blacksquare
\end{aligned}
)]
이 문서의 내용 중 전체 또는 일부는 2023-12-17 00:10:01에 나무위키 조건부분산 문서에서 가져왔습니다.