30 Sat

TIL

[Statistics 110] 9강- 기댓값, 지시확률변수와 선형성 (Expectation, Indicator Random Variables, Linearity)

CDF의 특성은 이산확률변수일 경우 부등호의 유무가 중요하지만 연속확률변수일 경우는 중요하지 않다.

우연속

  • 오른쪽에서 왼쪽으로 접근할 때 연속이라는 뜻

지시확률변수, Indicator => E(X) = P(A)

기댓값과 확률을 이어준다 => Fundamental Bridge 역할을 한다.

k = 0 부터 시작하지만, k = 0일때의 확률값이 0이므로 k = 1부터 시작한다.

또한 이 때, k에 관한 식이 되는 것은 다루기가 어려우므로 n에 대한 식으로 바꾸는 것이 두 번째 식.

n도 마찬가지의 이유로 n = 1부터 시작한다

이항 정리는 검색하면 알 수 있는데, 마지막 식이 (p+q)^n 의 형태로 바뀌게 되며 p+q = 1이기 때문에 저 식이 1로 계산된다.

매개변수 p를 가진 분포. 기하분포는 성공 이전에 얼마나 많은 실패가 있었는지를 보여준다. 기하는 성공하지 못하면 계속 성공할 때 까지의 횟수를 센다.

이항분포에서 확률질량함수가 유효하다는 것을 증명할 때 이항정리를 사용하였듯이 등비수열의 합으로 기하확률변수의 확률질량함수의 유효성을 증명

Story proof를 이용한 기댓값 구하기가 굉장히 인상적이다. c를 구할 것인데 처음에 실패했다고 하고(무조건 처음에 실패해야 하니까) 그 다음에 다시 성공 및 실패 여부를 따져보자는 것. 그러면 이는 다시 무한으로 반복하기 때문에 하나의 실패 1과 반복되는 식 c를 더한값이 실패할 확률 q로 나타나게 된다.

Last updated

Was this helpful?