16 Tue
[AI ์ค์ฟจ 1๊ธฐ] 10์ฃผ์ฐจ DAY 2
NLP : ์ธ์ด๋ชจ๋ธ I ~ II
์ธ์ด ๋ชจ๋ธ
๋ชฉํ : ๋ฌธ์ฅ์ด ์ผ์ด๋ ํ๋ฅ ์ ๊ตฌํ๋ ๊ฒ
๋ค์ ๋ฌธ์ฅ ๋ค์์ ์ด์ด์ง ๋จ์ด๋?
๋ค์ ๋ ๋ฌธ์ฅ ์ค ๋ํ๋ ํ๋ฅ ์ด ๋์ ๊ฒ์?
์ ํ์ํ๊ฐ?
๊ธฐ๊ณ ๋ฒ์ญ
high winds tonight => large winds tonight
๋ง์ถค๋ฒ ๊ฒ์ฌ
about fifteen minuets from => about fifteen minutes from
์์ฑ ์ธ์
I saw a van => eyes awe of an
์ฐ์์ ์ธ ๋จ์ด๋ค์ ํ๋ฅ ์ ๋ถ์ฌํ๋ ๋ชจ๋ธ
P(W) = P(w1, w2, w3, ... , wn)
๊ด๋ จ๋ ์ผ : ์ฐ์์ ์ธ ๋จ์ด๋ค์ด ์ฃผ์ด์ก์ ๋ ๊ทธ ๋ค์ ๋จ์ด์ ํ๋ฅ ์ ๊ตฌํ๋ ๊ฒ
P(wn) = p(w1, w2, ... , wn-1)
P(W) ๊ตฌํ๊ธฐ
๊ฒฐํฉํ๋ฅ ๊ตฌํ๊ธฐ
P(its, water, is ,so ,transparent, that)
์กฐ๊ฑด๋ถ ํ๋ฅ P(w | h)
P(the | its water is so transparent that) = Count(its water is so transparent that the) / Count(its water is so transparent that)
๋ฌธ์ ๋?
๊ฐ๋ฅํ ๋ฌธ์ฅ์ ๊ฐ์๊ฐ ๋๋ฌด ๋ง์
์ด๊ฒ์ ๊ณ์ฐํ ์ ์๋ ์ถฉ๋ถํ ์์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ธฐ ์ด๋ ค์
Markov Assumption
ํ ๋จ์ด์ ํ๋ฅ ์ ๊ทธ ๋จ์ด ์์ ๋ํ๋๋ ๋ช ๊ฐ์ ๋จ์ด๋ค์๋ง ์์กดํ๋ค
Unigram ๋ชจ๋ธ
Markov์ ๊ฐ์ ์ ๊ทน๋จ์ ์ผ๋ก ์ ์ฉํ ์
์์ฑ๋ ๋ฌธ์ฅ์์ ๋ค์ด ๋ถ์์ฐ์ค๋ฌ์
Bigram ๋ชจ๋ธ
๋น๊ต์ Unigram ๋ณด๋ค๋ ์์ฐ์ค๋ฌ์
N-gram ๋ชจ๋ธ
trigram, 4-grams, 5-grams
๋ฉ๋ฆฌ ๋จ์ด์ง ๋จ์ด๋ค๊ฐ์ ๊ด๊ณ๋ฅผ ์๋ฒฝํ๊ฒ ๋ชจ๋ธ๋งํ์ง ๋ชปํ๋ค
ํ์ง๋ง ๋ง์ ๊ฒฝ์ฐ์๋ n-gram๋ง์ผ๋ก๋ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๋ค.
Bigram ํ๋ฅ ๊ณ์ฐ
๋ชจ๋ธ ํ๊ฐ
์ธ์ฌ์ ํ๊ฐ
extrinsic evaluation
์กด์ฌ ์์ฒด๊ฐ ๋ชฉํ์ด๊ธฐ์ ํน์ ๊ณผ์ ๋ฅผ ์ํ ๋ถ๋ถ์ผ๋ก์ ์ฌ์ฉ๋จ
์ธ์ด๋ชจ๋ธ์ด ์ข์์ง๋ฅผ ํ๋จํ๊ธฐ ์ํด ๊ทธ ๊ณผ์ ์ ํ๊ฐ์งํ๋ฅผ ์ฌ์ฉ
ex) ๋ง์ถค๋ฒ ์ค๋ฅ ์์
๋ด์ฌ์ ํ๊ฐ
intrinsic evaluation
์ธ์ฌ์ ํ๊ฐ๋ ์๊ฐ์ด ๋ง์ด ๊ฑธ๋ฆฌ๋ ๋จ์ ์ด ์์
์ธ์ด๋ชจ๋ธ์ด ํ์ตํ๋ ํ๋ฅ ์์ฒด๋ฅผ ํ๊ฐํ ์ ์๋ค : Perplexity
์ด ๊ธฐ์ค์ผ๋ก ์ป์ ์ต์ ์ ์ธ์ด๋ชจ๋ธ์ด ์ค์ ๋ก ์ต์ ์ด ์๋ ์๋ ์๋ค.
ํ์ต๊ณผ์ ์ ๋ฒ๊ทธ๊ฐ ์์๋์ง ๋น ๋ฅด๊ฒ ์ ์ ์๋ ์ฉ๋๋ก ์ฌ์ฉ
Perplexity
์ข์ ์ธ์ด ๋ชจ๋ธ์ด๋
ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ๋์ ํ๋ฅ ๋ก ์์ธกํ๋ ๋ชจ๋ธ
Perplexity : ํ๋ฅ ์ ์ญ์๋ฅผ ๋จ์ด์ ๊ฐ์๋ก ์ ๊ทํํ ๊ฐ
Pexplexity๋ฅผ ์ต์ํํ๋ ๊ฒ์ด ํ๋ฅ ์ ์ต๋ํ ํ๋ ๊ฒ
Last updated
Was this helpful?