14 Thu
Last updated
Was this helpful?
Last updated
Was this helpful?
์ถ์ฒ :
x๊ฐ ์ฃผ์ด์ก์ ๋, ํด๋์ค์ ํ๋ฅ ์ x์ ๊ดํ ํจ์๋ก ๊ฐ์ ํ๊ณ , ํ๋ผ๋ฏธํฐ๋ฅผ ๋ฐ๋ก ๊ตฌํ๋ ๋ชจ๋ธ
๋ก์ง์คํฑ ํ๊ท(Logistic regression) : ๋ํ์ ์ธ ๋ฐฉ๋ฒโจ
ํด๋์ค C1์ ์ฌํ ํ๋ฅ = ํน์ฑ๋ฒกํฐ ์ ์ ํํจ์๊ฐ logistic sigmoid ๋ฅผ ํต๊ณผ ํจ์
์ด๋, ์ ๋ ฅํจ์ x๋์ ๋น์ ํ ๊ธฐ์ ํจ์ ์ฌ์ฉํจ.
์ ์์ logistic sigmoid ํจ์ :
ํด๋์ค C2์ ์ฌํ ํ๋ฅ ์ ๋ค์๊ณผ ๊ฐ์.
๊ฐ M์ฐจ์ ์ผ ๋, ๊ตฌํด์ผํ ํ๋ผ๋ฏธํฐ w์ ๊ฐ์๋ M
์ ์ฑ๋ชจ๋ธ์ ๊ฒฝ์ฐ์๋, M(M+5)/2+1๊ฐ์ ํ๋ผ๋ฏธํฐ ๊ตฌํด์ผํจ
์ด์ ๋ฐ๋ฉด, ๋ก์ง์คํฑ ํ๊ท๋ ํจ์ฌ๋ ์์ M์ linearํ ๊ฐ์์ ํ๋ผ๋ฏธํฐ๋ง ๊ตฌํด๋ ๋จ.
์ต๋์ฐ๋ํด
๋ฐ์ดํฐ ์ :
์ฐ๋ํจ์
์์ ๋ก๊ทธ์ฐ๋
๋ชจ์ ์ถ์ ์ ์ํด ์ฌ์ฉํ๋ฉฐ, ์ด๋ ํฌ๋ก์ค ์ํธ๋กํผ ์๋ฌํจ์(cross entropy error function)โ
ํฌ๋ก์ค ์ํธ๋กํผ(cross entropy error function)
์ ๋ณด์ด๋ก ์์
์ด์ฐํ๋ฅ ๋ณ์์ ๊ฒฝ์ฐ,
์ผ๋ฐ์ ์ผ๋ก ํฌ๋ก์ค ์ํธ๋กํผ๊ฐ ์ต์ํ๋ ๋, ๋ ํ๋ฅ ๋ถํฌ์ ์ฐจ์ด๊ฐ ์ต์ํ
๋ฐ๋ผ์, ์๋ฌํจ์ ์ต์ํ = ์ฐ๋ ์ต๋ํ = ๋ชฉํ ๋ณ์(๋ถํฌ)์ ์์ธก๊ฐ ๋ถํฌ ์ฐจ์ด ์ต์ํโ
์๋ฌํจ์ w์ gradient
์ด๋, ์ผ๋ก ๋ํ๋ผ ์ ์์.
๋ฐ๋ผ์, ์ด๋ฏ๋ก
์ ์ฒด์ ์ธ ์๋ฌ ํจ์ w์ gradient๋ ๋ค์๊ณผ ๊ฐ์.
๋ค์ค ํด๋์ค ๋ก์ง์คํฑ ํ๊ท(Multiclass logistic regression)
๋๋ ์ํํธ๋งฅ์ค ํ๊ท(Softmax regression) ๋ผ๊ณ ํจ.
์ํ x๊ฐ ์ฃผ์ด์ง๋ฉด ์ํํธ๋งฅ์ค ํ๊ท ๋ชจ๋ธ์ด ๊ฐ ํด๋์ค์ ๋ํ ์ ์ ๊ณ์ฐ
์ด์ ์ํํธ๋งฅ์ค ํจ์๋ฅผ ์ ์ฉํด์ ๊ฐ ํด๋์ค์ ํ๋ฅ ์ถ์ , ํ๋ฅ ์ด ๊ฐ์ฅ ํฐ ํด๋์ค ์ ํ(๋ชจ๋ ํ๋ฅ ์ ํฉ=1)
์ฐ๋ํจ์
ํน์ฑ ๋ฒกํฐ ๋ฅผ ์ํ ๋ชฉํ๋ฒกํฐ ๋ ํด๋์ค์ ํด๋นํ๋ ํ๋์ ์์๋ง 1(๋๋จธ์ง 0)์ธ 1-of-k ์ธ์ฝ๋ฉ ๋ฐฉ๋ฒ์ผ๋ก ํํ
์ด๋ฉฐ,
: ๋ฅผ ์์๋ก ๊ฐ๋ N x K ํฌ๊ธฐ์ ํ๋ ฌ
์์ ๋ก๊ทธ ์ฐ๋
์์ ์ฐ๋ํจ์๋ฅผ ์์ ๋ก๊ทธ๋ฅผ ์ทจํ๋ฉด,
์๋ฌํจ์ ์ต์ํ โ ํ๋ผ๋ฏธํฐ ๊ตฌํ๊ธฐ(์ ๋ํ gradient)
ํ๋์ ์ํ์ ๋ํ ์๋ฌ์ ๋ํด ์๋์ ๊ฐ์ด ์ ์ํ๋ฉด,
์ ๋ํ gradient
ํ์ด๋ ๋ค์๊ณผ ๊ฐ์
๊ฒฐ๊ณผ์ ์ผ๋ก, ๋ค์๊ณผ ๊ฐ์โ
โจ๏ธ ๊ณต๋ถํ๋ฉด์ ์ฐธ๊ณ ํ ์ฌ์ดํธ
n๊ฐ ์ค k๊ฐ์ ์นด๋์ ๋ํด์ ์ด๋ค ์ m์ ๊ฐ์ง ์นด๋๊ฐ m๋ฒ์งธ์ ์์ ํ๋ฅ ์ ์ ์๊ณผ ๊ฐ๋ค. ๊ทธ๋ฐ๋ฐ ์ฌ๊ธฐ์ n๊ฐ ์ค k๊ฐ์ ์นด๋์ ๋ํด์ ์ ์ฉํด์ผ ํ๋ฏ๋กโโ
์ ์ฒด ๋ ๋ฆฝ๊ณผ ์์ผ๋ก ๋ ๋ฆฝ์ ํ์ธํด์ผ ์ธ ์ฌ๊ฑด์ด ๋ ๋ฆฝ์์ ํ์ ํ ์ ์๋ค.
a) 6๊ฐ์ ์ฃผ์ฌ์ ์ค์์ ์ ์ด๋ ํ ๊ฐ๊ฐ โ6โ์ด ๋์จ ๊ฒฝ์ฐ
b) 12๊ฐ์ ์ฃผ์ฌ์ ์ค์์ ์ ์ด๋ ๋ ๊ฐ๊ฐ โ6โ์ด ๋์จ ๊ฒฝ์ฐ
c) 18๊ฐ์ ์ฃผ์ฌ์ ์ค์์ ์ ์ด๋ ์ธ ๊ฐ๊ฐ โ6โ์ด ๋์จ ๊ฒฝ์ฐ
โ ๋ต์ (a)
โด (a)๊ฐ ๊ฐ์ฅ ๋ฐ์ํ ํ๋ฅ ์ด ๋๋ค.
๊ฐ์ ์คํ์ ๋ฌดํ ๋ฒ ๋ฐ๋ณตํ ์ ์๋ค๋ฉด,
๋ค์๊ณผ ๊ฐ์ ์์ด ๊ตฌํด์ง๋ฉฐ ์ด๋ฅผ ๊ณฑํด ๋ง ๋จ๊ฒ ๋๋ค.
โ โ โ => ํ ์ผ๋ฌ ์๋ฆฌ์ฆ
์ด ์ฑ๋ฆฝํ ๋, ์ฌ๊ฑด A์ B๋ ๋ ๋ฆฝ์ด๋ค. A๊ฐ ์ผ์ด๋ฌ๋ค๊ณ ํด์ B๊ฐ ์ผ์ด๋ ์ง์ ๋ํ ์ด์ผ๊ธฐ๋ ํ์ง ๋ชปํ๋ค. (๋ฐฐ๋ฐ๊ณผ์ ์ฐจ์ด์ => ๋ฐฐ๋ฐ : A๊ฐ ์ผ์ด๋ฌ๋ค๋ฉด B๋ ์ผ์ด๋ ์๊ฐ ์๋ค.)
(6์ด ํ๋ฒ๋ ์๋์ฌ ํ๋ฅ + 6์ด ๋ฑ ํ๋ฒ ๋์ฌ ํ๋ฅ )
โโ โ ์ด๋ฅผ ๋ฒ ์ด์ฆ์ ์ ๋ฆฌ(Bayesโ Theorem)๋ผ ํ๋ค.