푸아송 분포 (문서 편집)

[[분류:확률 분포]]
[include(틀:통계학)]
[목차]

== 개요 ==
[[프랑스]]의 [[수학자]] 시메옹 드니 푸아송(Siméon Denis Poisson)이 1837년에 자신의 저서 『민사 사건과 형사 사건 재판에서의 확률에 관한 연구 및 일반적인 확률 계산 법칙에 관한 서문』[* Recherches sur la probabilité des jugements en matière criminelle et en matière civile; précédées des règles générales du calcul des probabilités]에서 처음 소개한 [[확률 분포]]. 그의 이름을 따서 '''푸아송 분포'''(Poisson distribution)라고 한다. 표기에 따라서는 '''포아송 분포'''라고도 한다.

단위시간 동안 혹은 단위공간에서 어떤 사건이 발생하는 횟수를 나타내는 확률분포이며, [math(n)]이 충분히 크고 [math(p)]가 충분히 작아서 [math(np)]의 값이 적당할 때의 [[이항 분포]]의 값을 근사적으로 구할 수 있다. 이항 분포에서 [math(np=\lambda)]를 유지하면서 [math(n\to\infty)]일 때, 그 분포는 포아송 분포에 수렴한다. 이에 따라 [math(n)]과 [math(p)]의 각각의 값은 모르지만 [math(np=\lambda)]의 값은 알 때 푸아송 분포를 사용하여 이항 분포의 근사치를 알 수 있다.

후술되어 있듯 [math(\lambda)]는 곧 푸아송 분포의 평균과 분산이 되며, '[[Λ|람다]]'로 읽는 [[그리스 문자]]이다.

== 조건 ==
푸아송 분포로 유의미한 근삿값을 얻으려면 다음 세 가지 조건을 만족시켜야 한다.
 * 주어진 시간 동안 일어나는 사건의 횟수는 다른 시간에서 일어나는 사건의 횟수와 독립이어야 한다.
 * 주어진 시간을 더 짧은 단위로 나눴을 때, 그 짧은 시간 내에서 사건이 두 번 이상 발생할 확률은 무시할 만큼 매우 작아야 한다.
 * 주어진 시간을 더 짧은 단위로 나눴을 때, 시간의 길이와 사건이 한 번 발생할 확률은 비례한다.

일반적으로, [math(n\geq 20)]이고 [math(p\leq 0.05)]이면 어느 정도 충분하고, [math(n\geq 100)]이고 [math(np\leq 10)]이면 매우 훌륭하다고 여겨진다.

== 유도 과정(푸아송 극한 정리) ==
[[이항 분포]]에서 [math(X\sim B(n,p))] 이고 [math(n\to\infty)], [math(p\to 0)], [math(np \to \lambda)]이면

||<bgcolor=#fff,#1f2023><table width=100%><tablebordercolor=#fff,#1f2023> [math(
\begin{aligned}
f(x;n,p) &= Pr(X=x)\\
&= \binom{n}{x} p^x (1-p)^{n-x}\\
&= \frac{n!}{(n-x)!x!}\left(\frac{\lambda}{n}\right)^x\left(1-\frac{\lambda}{n}\right)^{n-x}\\
&= \frac{\lambda^x}{x!}\frac{n(n-1) \cdot \cdot \cdot (n-x+1)}{n^x}\left(1-\frac{\lambda}{n}\right)^{n}\left(1-\frac{\lambda}{n}\right)^{-x}\\
\end{aligned}
)] ||

||<bgcolor=#fff,#1f2023><table width=100%><tablebordercolor=#fff,#1f2023>''''''
 * [math(n(n-1)\cdots(n-x+1))]에서 곱해진 항의 개수는 [math(x)]개이므로 [math(\displaystyle\lim_{n\to\infty}\dfrac{n(n-1)\cdots(n-x+1)}{n^x}=1)]
 * [math(-\displaystyle\frac{\lambda}{n}= \frac{1}{t})]로 치환하면 [math(\left(1-\displaystyle\frac{\lambda}{n}\right)^{n} 
 = \left(1+\displaystyle\frac{1}{t}\right)^{-\lambda t} 
 = \left[\left(1+\displaystyle\frac{1}{t}\right)^{t}\right]^{-\lambda})] 이고,  [math(\displaystyle\lim_{t\to\infty}\left(1+\dfrac1t\right)^t= )] '''[[자연로그의 밑|[math(e)]]]''' 이므로 [math(\displaystyle\lim_{t\to\infty}\left[\left(1+\displaystyle\frac{1}{t}\right)^{t}\right]^{-\lambda} = e^{-\lambda} )]
 * [math(\displaystyle\lim_{n\to\infty}\left(1-\dfrac\lambda{n}\right)^{-x}=1)]||

따라서 [math(n\to\infty)], [math(p\to 0)], [math(np \to \lambda)]이면 다음이 성립한다. 이를 '''푸아송 극한 정리'''(Poisson limit theorem)라고 한다.

{{{#!wiki style="text-align: center;"
[math(f(x;n,p)\approx\dfrac{\lambda^x e^{-\lambda}}{x!})]}}}
이렇게 유도되는 푸아송 분포를 다음과 같이 표기한다.

{{{#!wiki style="text-align: center;"
[math(f(x;\lambda)=\dfrac{\lambda^x e^{-\lambda}}{x!})]}}}
이 [math(\lambda)]가 바로 푸아송 분포의 모수(parameter)이며, 확률변수 [math(X)]가 모수 [math(\lambda)]인 푸아송 분포를 따르면

{{{#!wiki style="text-align: center;"
[math(X\sim{\rm Pois}(\lambda))]}}}
로 나타내고 [math(X)]를 모수가 [math(\lambda)]인 '''푸아송 확률변수'''(Poisson random variable)라고 한다.

== 의미 ==
{{{#!wiki style="text-align: center;"
[math(f(x;\lambda)=\dfrac{\lambda^x e^{-\lambda}}{x!})]}}}
이렇게 유도된 푸아송 분포의 확률변수 [math(X)]는 단위시간 혹은 단위공간 내의 발생 횟수이며, 이를 [math(x)]에 대입한다. 그리고 해당 단위시간 혹은 단위공간 내에서 평균적으로 발생하는 사건의 횟수를 [math(\lambda)]에 대입하면 해당 확률을 구할 수 있다.

== [[평균]]과 [[분산]] ==
우선 [math(p(x:\lambda)=\dfrac{\lambda^x e^{-\lambda}}{x!})]의 평균은 애초에 정한 바 그대로 [math(np=\lambda)]이다.

[math(p(x:\lambda)=\dfrac{\lambda^x e^{-\lambda}}{x!})]의 분산은 다음과 같이 구한다. 본디 이항 분포의 분산은 [math(np(1-p))]이므로

{{{#!wiki style="text-align: center;"
[math(np(1-p)=np=\lambda\;(\because p\to 0))]}}}
따라서 '''푸아송 분포의 평균과 분산은 [math(\boldsymbol\lambda)]로 같다.'''

== 누적분포함수 ==
{{{#!wiki style="text-align: center;"
[math(e^{-\lambda}\displaystyle\sum_{i=0}^{\lfloor k\rfloor} \frac{\lambda^i}{i!}=\frac{\Gamma(\lfloor k+1\rfloor, \lambda)}{\lfloor k\rfloor !})]}}}
[math(\Gamma(x,y))]는 [[불완전 감마 함수]], [math(\lfloor x \rfloor)]는 [[최대 정수 함수]]이다.

== [[적률생성함수]] ==
{{{#!wiki style="text-align: center;"
[math(\begin{aligned}M_X(t)&=E(e^{tX})\\&=\displaystyle\sum_{x=0}^\infty e^{tx}\dfrac{m^x e^{-m}}{x!}=\sum_{x=0}^\infty\dfrac{(e^tm)^x e^{-m}}{x!}\\&=\sum_{x=0}^\infty\dfrac{(e^tm)^x e^{-e^t m}e^{e^t m}e^{-m}}{x!}\\&=e^{e^t m}e^{-m}\sum_{x=0}^\infty\dfrac{(e^t m)^x e^{-e^t m}}{x!}\\&=e^{m(e^t-1)}\end{aligned})]}}}
따라서 푸아송 분포의 적률생성함수는 [math(e^{m\left(e^t-1\right)})]이며, 이 함수를 통해 평균과 분산을 계산하면 다음과 같다.

{{{#!wiki style="text-align: center;"
[math(\begin{aligned}M'_X(t)&=e^{m\left(e^t-1\right)}me^t\\M''_X(t)&=e^{m\left(e^t-1\right)}me^t+e^{m\left(e^t-1\right)}\left(me^t\right)^2\end{aligned})]

[math(\begin{aligned}\therefore E(X)&=M'_X(0)=m\\E(X^2)&=M''_X(0)=m+m^2\\{\rm Var}(X)&=E(X^2)-\{E(X)\}^2=m\end{aligned})]}}}
== 관련 문서 ==
 * [[이항 분포]]
[각주][include(틀:문서 가져옴, title=확률 분포, version=83, paragraph=2.1.2)]

저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,
기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.
이 동의는 철회할 수 없습니다.

푸아송 분포 (문서 편집)

캡챠