23 Sat

TIL

[Statistics 110] 7강- 도박꾼의 파산 문제와 확률변수 (Gambler's Ruin and Random Variables)

Gambler's Ruin(도박꾼의 파산): A와 B 두 명의 도박꾼이 매 라운드 $1씩 걸고 도박을 한다. 이긴 사람은 상대방의 $1을 가져가고, 둘 중 한 명이 가지고 온 돈이 바닥날 때까지 이 과정을 반복한다.

  • 이 문제는 0부터 N까지의 수직선위에 i 지점에 있는 벌레의 무작위 행보문제와 동일하다

p = P(A가 한 라운드를 이길 확률)

q = 1-p (B가 한 라운드를 이길 확률)

A는 i 달러, B는 N-i 달러를 가지고 게임을 한다고 할 때,

p의 확률로 A가 1달러를 더 얻고, q의 확률로 1달러를 잃는다. 0, N은 흡수상태(absorbing state)라 하여, 게임 종료를 나타낸다.

pip_i​​ : A가 i 달러로 시작하여 게임을 이길 확률 : P(A wins gameA start at i dollars) P(A ~wins ~game | A~ start~ at~ i~ dollars)

pi=ppi+1+qpi1(1iN1) p_i = p \cdot p_{i+1}+q \cdot p_{i-1}​ ( 1 \le i \le N-1) 이고, p0=0,pN=1p_0 = 0, p_{N} = 1 이다.

이를 계차방정식(difference equation)이라고 한다.(미분방정식의 이산 형태)

guessing을 통한 풀이

pi=xip_i = x^i라고 하자.

xi=pxi+1+qxi1x^i = p \cdot x^{i+1} +q \cdot x^{i-1}​​

px2x+q=0px^2 - x +q = 0

x=1±14pq2px = \large {\frac{-1 \pm \sqrt{1-4pq}}{2p}} 이고, q=1pq = 1-p이기 때문에, 14pq=(2p1)21-4pq = (2p-1)^2​​ 이 성립한다.

따라서 x{1,qp}x \in \{1, \large\frac{q}{p} \} 이 때, 우리가 관심있는 것은 p와 q가 다를 떄 이다.

→ 두 해가 다른 경우 다음과 같이 선형인 식으로 표현한다.

pi=A1i+B(qp)i​​(pq)p_i = A\cdot 1^i + B \cdot (\large\frac{q}{p})^i​​ (p \ne q)

여기에 조건 p0=0,pN=1p_0 = 0, p_{N} = 1 을 대입하면,

p0=A+B=0p_0 = A+B = 0 B=A\rightarrow B=-A

pN=A+B(qp)N​​​=A(1(qp)N)=1p_N = A +B \large(\frac{q}{p})^N​​​ = A(1-\large(\frac{q}{p})^N)=1

A=11(qp)NA = \Large \frac{1}{1-(\frac{q}{p})^N}

pi=1(qp)i1(qp)Ni(pq)p_i = \Large{\frac{1-(\frac{q}{p})^i}{1-(\frac{q}{p})^{N-i}}}(p \ne q)

그리고 p=qp = q 인 경우,

x=qpx = \large\frac{q}{p} 라고 놓고 x1 x \rightarrow 1 의 극한을 살펴보았을 때,

limx1=limx11xi1xN​​=limx1i(xi1)N(xN1)=iN\lim_{x \rightarrow 1} = \lim_{x \rightarrow 1}{\large\frac{1-x^i}{1-x^N}}​​ = \lim_{x \rightarrow 1} \large \frac{i(x^{i-1})}{N(x^{N-1})} = \large \frac{i}{N}

pi=1(qp)i1(qp)Ni(pq) or iN (p=q)\Rightarrow p_i = {\Large{\frac{1-(\frac{q}{p})^i}{1-(\frac{q}{p})^{N-i}}}} (p \ne q) ~ or ~ {\large \frac {i}{N}​}~ (p = q)

해석

하우스와 같은 돈을 가지고 시작하고, 1%정도로만 불공평한 게임이라고 해도 게임을 계속하다 보면 이길 확률이 매우 적어지게 된다. ('도박꾼의 파산')

확인할 점: 게임이 끝나지 않고 영원히 계속될 확률이 있는가?

게임이 공평한 상황에서 (p = q) B가 (N-i 달러를 갖고) 이길 확률은 NiN\large \frac {N-i}{N}​이다.

iN+NiN=1\large \frac{i}{N} + \frac{N-i}{N}=1 이므로 게임이 계속될 확률은 0이다.

확률변수(Random Variable): 표본공간 S부터 실수 체계 R로 '맵핑' 하는 함수

예시) 베르누이(Bernoulli) 확률변수

X가 0(실패), 1(성공) 두 가지의 값만 가질 수 있으며,

P(x=1)=p, P(X=0) = 1-p 일 때

X는 Bernoulli(p) 분포를 따른다고 한다.

예시) 이항(Binomial) 확률변수

n번의 독립적인 베르누이(p) 시행에서 성공 횟수의 분포는 Bin(n,p) 를 따른다고 한다.

  • 이항확률변수의 확률질량변수(PMF): P(X=k)=(nk)pk(1p)nkP(X = k) = {n\choose k} p^k(1-p)^{n-k}

  • 이항확률변수의 특징

X~Bin(n,p), Y~ Bin(m,p) 일 때,

X+Y~Bin(n+m,p) 를 따른다.

Last updated

Was this helpful?