조건부분산

덤프버전 :


    통계학

Statistics
[ 펼치기 · 접기 ]




1. 개요
2. 정의
3. 성질


1. 개요[편집]


Conditional Variance

조건부 확률분포를 이용하여 조건부 분산을 정의할 수 있다.


2. 정의[편집]


이산 확률 변수

X와 Y가 이산 확률 변수인 경우 X가 주어진 경우 Y의 조건부 분산은 다음과 같이 정의된다.

[math(
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \displaystyle\sum_y y^2P(Y=y|X=x) - (\displaystyle\sum_y yP(Y=y|X=x))^2
\end{aligned}
)]


연속 확률 변수

X와 Y가 연속 확률 변수이며, [math(f_{X,Y}(x,y))] 가 X 와 Y 의 결합 분포 이며, [math(f_X(x))] 가 X의 확률 밀도 함수 이면, X 가 주어진 경우 Y의 조건부 분산은 다음과 같이 정의된다.

[math(
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \int y^2 \frac{f_{X,Y}(x,y)}{f_X(x)}dy - (\int y \frac{f_{X,Y}(x,y)}{f_X(x)}dy)^2\\
&= \int y^2 f_{Y|X}(y|x)dy - [\int y f_{Y|X}(y|x)dy]^2
\end{aligned}
)]


[math(E[Y | X = x])] 는 X가 주어진 경우 Y의 조건부기댓값 이다.

주의할점은, [math(Var[Y | X = x])] 는 [math(X = x)] 가 주어진 경우 Y의 조건부 분산이나 [math(Var[Y | X])] 는 X 가 어떤값을 무작위로 가질때 Y의 조건부 분산을 나타내는 확률 변수이다.


3. 성질[편집]


분산이 가지고 있는 모든 성질을 가지고 있다.

부가적으로, X 와 Y 가 확률변수일 경우 아래의 성질이 성립한다.

[math(Var[Y] = E[Var[Y | X]] + Var[E[Y | X]])] 전체 분산의 법칙 또는 반복 분산의 법칙 이라 불린다.

[ 증명 ]
[math(
\begin{aligned}
Var[Y] &= E[Y^2] - E[Y]^2\\
&= E[E[Y^2 | X]] - E[E[Y|X]]^2\\
&= E[Var[Y | X] + E[Y | X]^2] - E[E[Y|X]]^2\\
&= E[Var[Y | X]] + E[E[Y | X]^2] - E[E[Y | X]]^2\\
&= E[Var[Y | X]] + Var[E[Y|X]] \quad\quad \blacksquare
\end{aligned}
)]

파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-12-17 00:10:01에 나무위키 조건부분산 문서에서 가져왔습니다.

관련 문서