13 Wed

TIL

[AI 스쿨 1기] 6주차 DAY 3

출처 : https://github.com/sujiny-tech/k-digital-training-AI-dev/blob/main/Machine-Learning-basics/Linear%20Models%20for%20Classification.mdarrow-up-right

선형 분류(Linear Classification)

  • 분류 목표 : 입력벡터 xK개의 가능한 클래스 중 하나의 클래스로 할당

  • 분류를 위한 결정이론

    • 확률적 모델(probabilistic model)

    • 판별함수(discriminant model)

      확률 계산 없이 입력 x를 클래스로 할당하는 판별함수 구하기(찾기)

판별함수 (Discriminant model)

분류를 위한 최소제곱법 (Least squares for classification)

퍼셉트론 알고리즘 (The perceptron algorithm)

⭐ 최소제곱법과 퍼셉트론 모두 output 출력하지만, 확률을 계산하진 않음❗

확률적 생성 모델 (Probabilistic Generative Models)

⭐ 2-class : logistic sigmoid function를 이용, k-class : softmax function를 이용❗

  • 연속적 입력 (continuous inputs)

    • arrow-up-right가 가우시안 분포를 따르고, 모든 클래스에 대해 공분산이 동일하다고 가정하자.

    • 가정 하에 어떤 클래스가 주어졌다면, 해당 데이터를 output하는 확률은 다음과 같음.

      arrow-up-right

    • 2-class에 대해서,

      arrow-up-right

      이때, w벡터와 w0는 다음과 같음.

      arrow-up-right

      a에 대한 전개

    • k-class에 대해서는 다음과 같이 확장 가능.

  • 최대우도해 (Maximum likelihood solution)

데이터가 이산일 때 (Discrete features)

[Statistics 110]

Present Part [3 / 34]

3강- Birthday Problem과 확률의 특성 (Birthday Problem, Properties of Probability)

생일 문제 : 생일이 같은 두 명의 사람을 찾기

  • 가정

    • 2월 29일은 제외한다

    • 365일이 모두 동일한 확률을 가진다

      • 실제로는 그렇지 않다. 예를 들어 9월에 출생이 많다.

      • 독립 : 한 사람의 생일이 다른 사람의 생일에 영향을 미치지 않는다.

최소한 몇명의 사람이 있어야 50%의 확률을 만족할까?

  • 365개의 상자에 공을 최소한 하나씩 집어넣는 경우와 동일

  • 사람이 366명일 경우는 확률이 1이다.

    • 이를 비둘기집 원리라고 한다

  • 대부분의 사람들은 직관적으로 150~180명을 이야기하며 보통 100을 넘는다.

  • 실제로는 23명이 있을 때 50.7%의 확률을 가진다

모두의 생일이 같지 않을 확률

  • 이를 1에서 빼면 적어도 두 명이 생일이 같을 확률을 구하는 것과 같다

  • P(no match) = 365364    (365k+1)365k \frac {365 \cdot 364 \cdot \ \ \cdots \ \ \cdot (365 - k + 1)} {365^k} : 365개의 날짜 중 1명이 한 날짜를 차지하면 다른 1명은 남은 364개의 날짜 중 한 날짜를 차지하는 방법

  • P(match)

    • 50.7% if k = 23

    • 97.0% if k = 50

    • 99.999% if k = 100

k에 대한 직관

  • (k2)=k(k1)2 {k \choose 2} = {k(k-1) \over 2}

  • (232)=23222=253 {23 \choose 2} = {23 \cdot 22 \over 2} = 253

    • 23은 작은 수지만, 23명이 만들 수 있는 쌍의 수는 253개이며 충분히 적어도 한쌍이 생일이 같은지 비교할 수로는 작은 수는 아니다

  • 생일이 같거나 하루 차이 날 확률

    • about 50% if k = 14

확률 정리

  • 기본 정리

    • P(\varnothing) = 0, P(S) = 1 and it also means 0P(A)1 0 \le P(A) \le 1

    • P(n=1)=n=1P(An)    if  An  is  disjoint  with  Am(mn) P (\cup^\infty_{n=1}) = \sum^\infty_{n=1}P(A_n) \ \ \ \ if \ \ A_n \ \ is \ \ disjoint\ \ with \ \ A_m(m \not= n)

  • 속성

    • P(Ac)=1P(A) P(A^c) = 1 - P(A)

      • Proof

        • 1=P(S)=P(AAc)=P(A)+P(Ac)  sinceAAc= 1= P(S) = P(A \bigcup A^c) = P(A) + P(A^c) \ \ since A \bigcap A^c = \varnothing

    • If AB A \subseteq B , then P(A)P(B) P(A) \leq P(B)

      • Proof

        • B=A(BAc) B = A \bigcup (B \bigcap A^c) , disjoint

        • P(B)=P(A)P(BAc) P(B) = P(A) \bigcup P(B \bigcap A^c)

    • P(AB)=P(A)+P(B)P(AB) P(A \bigcup B) = P(A) + P(B) - P(A \bigcap B)

      • Proof

        • P(AB)=P(A(BAc))=P(A)+P(BAc)?=P(A)+P(B)P(AB) P(A \bigcup B) = P(A \bigcup (B \bigcap A^c)) = P(A) + P(B \bigcap A^c) ?= P(A) + P(B) - P(A \bigcap B)

        • P(B)=P(AB)+P(AcB) P(B) = P(A \bigcap B) + P(A^c \bigcap B) => True

        • since, P(AB),P(AcB) P(A \bigcap B), P(A^c \bigcap B) are disjoint, union is B

      • 포함배제의 원리, inclusion-exclusion

    • P(A1A2An)=i=1nP(Ai)i<jP(AiAj)+i<j<kP(AiAjAk)+(1)n+1P(AiAn) P(A_1 \bigcup A_2 \bigcup \cdots \bigcup A_n) = \sum_{i=1} ^n P(A_i) - \sum_{i \lt j} P(A_i \bigcap A_j) + \sum_{i \lt j \lt k} P(A_i \bigcap A_j \bigcap A_k) - \cdots + (-1)^{n+1}P(A_i \bigcap \cdots \bigcap A_n)

몽모르트 문제 : 드 몽모르트가 만든 문제

  • 도박에서 처음 나온 문제

  • 1부터 n까지 적혀있고 각 수마다 한 장만 존재하는 카드 뭉치가 존재

  • 카드를 셔플 후, 카드 뭉치에 있는 카드의 순서와 카드의 값이 일치하는 경우 승리

  • 포함배제의 원리를 이용하여 푸는 것이 가장 쉽다

  • P(Aj)=1n P(A_j) = {1 \over n} , j카드가 j-th에 있을 확률, 이 때 j에 대한 식이 아니다

  • P(A1A2)=(n2)!n!=1n(n1) P(A_1 \bigcap A_2) = { (n-2)! \over n!} = {1 \over n(n-1)} , n개의 카드 중 1과 2가 각각 첫번째와 두번째에 있어야 함

  • P(A1AK)=(nk)!n! P(A_1 \bigcap \cdots \bigcap A_K) = { (n-k)! \over n!}

  • P(A1AK)=n1nn(n1)2!1n(n1)+n(n1)(n2)3!1(n(n1)(n2)=112!++(1)n1n!=11e P(A_1 \bigcup \cdots \bigcup A_K) = n \cdot {1 \over n} - {n(n-1) \over 2! }{1 \over n(n-1)} + { n(n-1)(n-2) \over 3! }{1 \over (n(n-1)(n-2)} - \cdots \\ = 1 - {1 \over 2!} + \cdots + (-1)^n {1 \over n!} = 1 - {1 \over e}

  • 테일러 급수와 비슷한 모양

Last updated