도박꾼의 파산

덤프버전 :

분류


    통계학

Statistics
[ 펼치기 · 접기 ]




1. 개요
2. 역사
3. 상세
4. 공정한 도박
5. 비공정한 도박



1. 개요[편집]


Gambler's Ruin

유한한 초기 자산을 가지고 도박을 하는 도박꾼은 결국에는 파산하게 된다는 통계학적 개념이다.


2. 역사[편집]



도박꾼의 파산의 문제가 처음 언급된건 1656년에 블레즈 파스칼피에르 드 페르마에게 보낸 편지에서이다.

아래 원문은 1656년에 피에르 드 카르카비가 크리스티안 하위헌스 에 보낸 편지에서 적힌 내용이며, 파스칼이 처음 제시한 확률 문제를 요약한 내용이다.

Let two men play with three dice, the first player scoring a point whenever 11 is thrown, and the second whenever 14 is thrown. But instead of the points accumulating in the ordinary way, let a point be added to a player's score only if his opponent's score is nil, but otherwise let it be subtracted from his opponent's score. It is as if opposing points form pairs, and annihilate each other, so that the trailing player always has zero points. The winner is the first to reach twelve points; what are the relative chances of each player winning?

두 사람이 세 개의 주사위를 던집니다. 첫 번째 플레이어는 11이 던져질 때마다 점수를 얻고, 두 번째 플레이어는 14가 던져질 때마다 득점합니다. 다만, 일반적인 방식으로 점수을 획득하는 대신 상대 점수가 0인 경우에만 플레이어 점수에 1점을 추가하고 그렇지 않으면 상대방 점수에서 1점을 뺍니다. 마치 두 플레이어 간의 승점이 쌍을 이루어 지고 있는 플레이어의 승점이 항상 0 점이 되도록 말입니다. 12점에 먼저 도달하는 플레이어가 승자입니다. 각 플레이어가 이길 확률은 얼마입니까?


아래 원문은 현대에 이루어서 재해석된 도박꾼의 파산 문제이다.

Consider a familiar gambler who wins or loses a dollar with probabilities p and q, respectively. He has the initial capital, z, and plays against an opponent with the initial capital, a-z. The game continues until the gambler's capital either is reduced to zero or has increased to a, that is, until one of the two players is ruined. What is the probability of the gambler's ruin?

각각 확률 p와 q로 1달러를 따거나 잃는 도박꾼이 있다. 두 명의 도박꾼이 각 각 z 와 a-z 만큼의 초기 자본을 가지고 게임을 한다고 한다. 두명 중 한명의 자산이 a 가 될때 까지 게임을 지속한다. 즉, 두 명중 한명이 파산할때까지 게임을 지속한다. 도박꾼이 파산할 확률은 얼마인가?



3. 상세[편집]


각 도박꾼이 각각 [math(p = \frac{1}{2})] 확률로 1달러를 획득하고, [math(q = 1-p = \frac{1}{2})] 확률로 1달러를 잃는다고 가정하자. 매판의 게임은 이전에 게임에 영향을 받지 않기 때문에 독립적이다.
  • [math(P(x))] 를 도박꾼 플레이어 1이 x달러로 시작했을때 파산할 확률이라 정의하자.
도박꾼이 x달러의 초기자산으로 한 판의 게임에서 이길 경우 파산할 확률은 [math(P(x+1))] 이며, 게임에서 질 경우 파산할 확률은 [math(P(x-1))] 이다.
  • A 를 도박꾼이 결국에는 파산하는 사건이라 정의하자.
  • W, L를 각각 도박꾼이 게임에서 이기는 사건, 지는사건이라 정의하자.

조건부 확률에 의하여, 아래 식이 성립하게 된다.

분류

[math(
P(A) = P(A|W)P(W) + P(A|L)P(L)

)]


따라서, 도박꾼이 x달러의 초기자산으로 시작 할 경우, 위 식에 의하여 아래 식이 성립하게 된다.

분류

[math(
P(x) = pP(x+1) + (1-p)P(x-1), \quad P(0) = 1, P(a) = 0

)]


위 식은 2차 선형 동차 차분방정식 이므로, [math(pr^2-r+(1-p) = 0)] 특성 방정식을 통해 풀수있다.


4. 공정한 도박[편집]


공정한 도박, 즉 [math(p = \frac{1}{2})] 일 때는,

분류

[math(
P(x) = \displaystyle\frac{P(x+1)+P(x-1)}{2}

)]


이므로, 굳이 특성방정식을 이용해 풀 필요가 없다. 위 식을 보면 P(x) 는 P(x+1) 와 P(x-1) 의 평균 또는 중간점이라 볼수있다. 이러한 성질을 가지는 함수는 1차함수 이기 때문에, P(x) 는 P(x) = mx+b 형태의 꼴이라 볼수 있다. 경계조건들을 대입하게 되면 아래와 같은 공식이 나온다.

분류

[math(
P(x) = 1-\displaystyle\frac{x}{a}

)]


아래는 특성 방정식을 통한 풀이이다.

[ 특성 방정식을 통한 풀이 ]
[math(
\begin{aligned}
0 &= pr^2-r+(1-p), \quad p = \frac{1}{2}\\
&= \frac{1}{2}(r-1)^2
\end{aligned}
)]
[math(r = 1)] 이라는 해가 1개 밖에 존재하지 않는다.
따라서, [math(
P(x) = Ax(1)^x + B(1)^x = Ax + B
)]
경계 조건들을 대입하면 아래 식이 성립함을 보일수 있다.
[math(
P(x) = 1-\frac{x}{a}
)]


x가 커지면 커질수록 즉, 도박꾼 플레이어 1의 초기 자본이 많으면 많을 경우 파산할 확률이 적어지게 된다. [math(a \rightarrow \infty, \quad z << a)] 라고 가정 할 경우, 즉, 도박꾼 플레이어 2가 돈이 매우 많아 손실을 사실상 무한대로 처리할 능력이 있다고 가정할 경우, [math(P(z) \approx 1 )] 이 성립한다. 따라서, 도박꾼 플레이어 2가 초기 자본이 매우 많을 경우, 도박꾼 플레이어 1는 결국에는 파산 하게 된다. 도박꾼 플레이어 1는 카지노 이용자이고, 도박꾼 플레이어 2는 카지노 하우스라고 생각해보면 결국에는 카지노에서 아무리 공정한 게임을 하더라도 결국에는 카지노 이용자는 파산 한다는것이다.[1]



5. 비공정한 도박[편집]


먼저, [math(pr^2-r+(1-p) = 0)] 식은 이차함수이므로 근의 공식을 통해 r에 대하여 풀면된다.

분류

[math(
\begin{aligned}
r &= \displaystyle\frac{-(-1) \pm \sqrt{(-1)^2 -4(p)(1-p)}}{2p}\\
&= \displaystyle\frac{+1 \pm \sqrt{1 -4p+4p^2}}{2p}\\
&= \displaystyle\frac{+1 \pm \sqrt{(1-2p)^2}}{2p}\\
&= \displaystyle\frac{+1 \pm (1-2p)}{2p}\\
&= \displaystyle\frac{2-2p}{2p}, \frac{2p}{2p}\\
&= \displaystyle\frac{1-p}{p}, 1
\end{aligned}
)]
[1] 카지노에 있는 모든 게임이 하우스 측이 약간 더 유리하다는걸 감안하면 왜 카지노가 돈을 벌고, 카지노 이용자들의 대부분은 돈을 잃는지 알수 있다.


따라서,

분류

[math(
P(x) = A(\displaystyle\frac{1-p}{p})^x + B(1)^x = A(\displaystyle\frac{1-p}{p})^x + B
)]


경계조건인 [math(P(0) = 1, P(a) = 0)] 을 대입하면 A 와 B를 구할수 있다.

분류

[math(A = \displaystyle\frac{1}{1-(\frac{1-p}{p})^a}, \quad B = 1-\displaystyle\frac{1}{1-(\frac{1-p}{p})^a})]


다시, [math(P(X))] 식에 A 와 B 를 대입하면 아래와 같다.

분류

[math(
\begin{aligned}
P(x) &= \frac{(\displaystyle\frac{1-p}{p})^x}{1-(\displaystyle\frac{1-p}{p})^a} + 1 - \frac{1}{1-(\displaystyle\frac{1-p}{p})^a}\\
&= 1+\frac{(\displaystyle\frac{1-p}{p})^x-1}{1-(\displaystyle\frac{1-p}{p})^a}
\end{aligned}
)]


[math(p < q)] 라고 가정해볼 경우, 전과 마찬가지로 x가 커지면 커질수록 즉, 도박꾼 플레이어 1의 초기 자본이 많으면 많을 경우 파산할 확률이 적어지게 된다. 전과 동일하게, 도박꾼 플레이어 1를 카지노 이용자로 두고, 도박꾼 플레이어 2를 카지노 하우스측 이라 가정해보자. 수학적으로 [math(a \rightarrow \infty, \quad z << a)] 보면, 마찬가지로 [math(P(z) \approx 1 )] 이 성립하며 도박꾼 플레이어 1는 결국에는 파산 하게 된다.

단, [math(p > q)] 라고 가정 할 경우, [math(P(z) \approx (\frac{1-p}{p})^z )] 가 된다. 따라서, 도박꾼 플레이어 2가 초기자본을 얼마나 가지고 있더라도, 도박꾼 플레이어 1가 확률적으로 나쁘지 않다.
파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-11-23 11:14:25에 나무위키 도박꾼의 파산 문서에서 가져왔습니다.