10 Wed

[Statistics 110] 14강- 위치, 척도 및 무의식적인 통계학자의 법칙(Location, Scale, and LOTUS)

정규분포의 특성

  • 대칭이라는 이유로 홀수차의 적률은 모두 0이다.

  • 짝수차의 적률은 2차까지만 쉽고, 4차부터는 어려운 식들이 연속되게 된다.

  • -Z 정규분포는 거꾸로된 종모양의 그래프가 되지만 모양 자체가 바뀌지는 않는다.

  • u를 평균 또는 위치라고 한다. 밀도를 더하거나 뺴지 않고

  • az를 척도 라고 한다. 커브가 얼머나 넓고 좁은지에 대한 영향을 준다.

  • 분산은 기댓값과 달리 선형적이지 못하다. 상수가 그대로 나오지 않고(제곱되어서 나옴) 분산합도 나오지 않다.

  • VAR(X + X) = VAR(2X) = 4VAR(X) 임을 알 수 있다.

표준화

  • 표준화는 반대방향(분포 -> 정규분포)으로 가는 것을 의미

  • 첫번째 식을 두번째 식으로 바꾼것과 동일

  • 서로 다른 두 분포의 확률을 비교할 수는 없는데 표준화는 이를 가능하게 해준다.

    • 마치 10m^2와 10feet를 직관적으로 어느것이 더 큰지 알 수 없는 것과 동일

  • 여러 개의 독립인 확률 변수들의 연산에 대한 정규 분포

    • 평균은 선형적으로 더하거나 빼면 그대로 적용된다.

    • 분산은 더하거나 빼도 늘 합한 결과

    • 정규분포 끼리 더해도 정규 분포가 된다.

68-95-99.7% Rule

  • 실제로 표준편차를 두 번 더하거나 빼는 일들이 95% 확률로 존재한다는 의미이다.

포아송분포의 분산

  • 이 때 양변을 미분한다. 그리고 다시 양변에 람다를 곱한다. 이러한 이유는 한번 더, 미분을 하고싶은데 그러면 k-1이 내려오기 때문에 다시 한번 람다를 곱해서 k로 지수를 설정하고 미분하려고 하기 때문이다.

    • 두 번 미분을 해서 k의 제곱을 만드는 이유는 X^2의 기댓값을 구하기 위해서이다.

  • 평균도, 분산도 람다이다.

이항 분포의 분산

  • 어렵게 구하는 방법은 이항분포의 확률질량함수를 구한뒤 수열의 합을 구하는 방법이다.

  • 가장 쉬운 방법은 두 독립변수의 합은 두 분산의 합이다 를 이용하는 것.

    • 이 부분을 증명할 수 있다면 바로 적용 가능하다

    • 이항분포는 N개의 베르누의 확률 변수라는 것. 베르누이 확률 변수 p의 분산만 구하면 된다

    • 추후에 이 방법은 다시 언급

  • 그 다음으로 쉬운 방법은 다음과 같다.

  • 이 때 E(I1I2)가 p^2이 된다는 이야기는 두 번 다 성공의 확률로 계산했다는 뜻이다.

    • 하나라도 실패했을 경우 0이 되기 때문

무의식적 통계학자의 법칙 LOTUS의 증명

Last updated

Was this helpful?