10 Wed
[Statistics 110] 14강- 위치, 척도 및 무의식적인 통계학자의 법칙(Location, Scale, and LOTUS)
정규분포의 특성

대칭이라는 이유로 홀수차의 적률은 모두 0이다.
짝수차의 적률은 2차까지만 쉽고, 4차부터는 어려운 식들이 연속되게 된다.

-Z 정규분포는 거꾸로된 종모양의 그래프가 되지만 모양 자체가 바뀌지는 않는다.
u를 평균 또는 위치라고 한다. 밀도를 더하거나 뺴지 않고
az를 척도 라고 한다. 커브가 얼머나 넓고 좁은지에 대한 영향을 준다.

분산은 기댓값과 달리 선형적이지 못하다. 상수가 그대로 나오지 않고(제곱되어서 나옴) 분산합도 나오지 않다.
VAR(X + X) = VAR(2X) = 4VAR(X) 임을 알 수 있다.
표준화


표준화는 반대방향(분포 -> 정규분포)으로 가는 것을 의미
첫번째 식을 두번째 식으로 바꾼것과 동일

서로 다른 두 분포의 확률을 비교할 수는 없는데 표준화는 이를 가능하게 해준다.
마치 10m^2와 10feet를 직관적으로 어느것이 더 큰지 알 수 없는 것과 동일
여러 개의 독립인 확률 변수들의 연산에 대한 정규 분포
평균은 선형적으로 더하거나 빼면 그대로 적용된다.
분산은 더하거나 빼도 늘 합한 결과
정규분포 끼리 더해도 정규 분포가 된다.
68-95-99.7% Rule


실제로 표준편차를 두 번 더하거나 빼는 일들이 95% 확률로 존재한다는 의미이다.
포아송분포의 분산

이 때 양변을 미분한다. 그리고 다시 양변에 람다를 곱한다. 이러한 이유는 한번 더, 미분을 하고싶은데 그러면 k-1이 내려오기 때문에 다시 한번 람다를 곱해서 k로 지수를 설정하고 미분하려고 하기 때문이다.
두 번 미분을 해서 k의 제곱을 만드는 이유는 X^2의 기댓값을 구하기 위해서이다.


평균도, 분산도 람다이다.
이항 분포의 분산
어렵게 구하는 방법은 이항분포의 확률질량함수를 구한뒤 수열의 합을 구하는 방법이다.
가장 쉬운 방법은
두 독립변수의 합은 두 분산의 합이다
를 이용하는 것.이 부분을 증명할 수 있다면 바로 적용 가능하다
이항분포는 N개의 베르누의 확률 변수라는 것. 베르누이 확률 변수 p의 분산만 구하면 된다
추후에 이 방법은 다시 언급
그 다음으로 쉬운 방법은 다음과 같다.

이 때 E(I1I2)가 p^2이 된다는 이야기는 두 번 다 성공의 확률로 계산했다는 뜻이다.
하나라도 실패했을 경우 0이 되기 때문
무의식적 통계학자의 법칙 LOTUS의 증명

그룹화된 식(좌변)과 그룹화되지 않은 식(우변)에 대한 비교
이것이 왜 같은가? 적절한 방법으로 바꾸면 같아진다
자갈들에 대한 질량합을 구하는 이중합 과정
Last updated
Was this helpful?