5 Fri

[ํŒŒ์ด์ฌ ๋”ฅ๋Ÿฌ๋‹ ํŒŒ์ดํ† ์น˜] PART 02 AI Background

01 ์ธ๊ณต์ง€๋Šฅ(๋”ฅ๋Ÿฌ๋‹)์˜ ์ •์˜์™€ ์‚ฌ๋ก€

์ธ๊ณต์ง€๋Šฅ

  • ์ธ๊ฐ„์˜ ์ง€๋Šฅ์œผ๋กœ ํ•  ์ˆ˜ ์žˆ๋Š” ์‚ฌ๊ณ  ํ•™์Šต, ์ž๊ธฐ ๊ฐœ๋ฐœ ๋“ฑ์„ ์ปดํ“จํ„ฐ๊ฐ€ ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์—ฐ๊ตฌํ•˜๋Š” ์ปดํ“จํ„ฐ ๊ณตํ•™ ๋ฐ ์ •๋ณด ๊ธฐ์ˆ ์˜ ํ•œ ๋ถ„์•ผ๋กœ, ์ปดํ“จํ„ฐ๊ฐ€ ์ธ๊ฐ„์˜ ์ง€๋Šฅ์ ์ธ ํ–‰๋™์„ ๋ชจ๋ฐฉํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ฒƒ

  • ์ปดํ“จํ„ฐ๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•ด ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ธฐ์ˆ 

์ธ๊ณต์ง€๋Šฅ์˜ ์‚ฌ๋ก€

  • ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜

  • ๊ฐ์ฒด ํƒ์ง€

  • ํ…์ŠคํŠธ

    • ๊ธฐ๊ณ„ ๋ฒˆ์—ญ

    • ๋ฌธ์žฅ(๋˜๋Š” ๋ฌธ์„œ) ๋ถ„๋ฅ˜

    • ์งˆ์˜ ์‘๋‹ต ์‹œ์Šคํ…œ

    • ๊ฐœ์ฒด๋ช… ์ธ์‹

  • ์•ŒํŒŒ๊ณ 

  • GAN

    • Generative Adversarial Networks

  • Style Transfer

    • ๋‚˜์˜ ์‚ฌ์ง„์„ ๊ณ ํํ’์œผ๋กœ ๋ฐ”๊ฟ”์ฃผ๊ฑฐ๋‚˜ ๋‚ฎ ํ’๊ฒจ์˜ ์‚ฌ์ง„์„ ๋ฐค ํ’๊ฒฝ์˜ ์‚ฌ์ง„์œผ๋กœ ๋ฐ”๊ฟ”์ฃผ๋Š” ๊ฒƒ

  • Deepfake

02 ํŒŒ์ดํ† ์น˜

  • ํ…์„œํ”Œ๋กœ์šฐ

    • ๊ตฌ๊ธ€์ด ๋งŒ๋“ค์—ˆ๊ณ  ํŒŒ์ดํ† ์น˜๋ณด๋‹ค ๋จผ์ € ์ถœ์‹œ๋จ

    • ์ฝ”๋“œ๊ฐ€ ์ง๊ด€์ ์ด์ง€ ์•Š๊ณ  ๋””๋ฒ„๊น…์ด ์–ด๋ ต๋‹ค

    • ์ด๋Ÿฌํ•œ ๋‹จ์ ์„ ๋ณด์™„ํ•˜๊ธฐ ์œ„ํ•ด 2.0 ๋ฒ„์ „ ์ด์ƒ์—์„œ๋Š” ์ผ€๋ผ์Šค๋ฅผ ์ด์šฉํ•ด ๊ฐ€๋…์„ฑ๊ณผ ํŽธ์˜์„ฑ์„ ์ œ๊ณต

  • ํŒŒ์ดํ† ์น˜

    • ํŽ˜์ด์Šค๋ถ์ด ๋งŒ๋“ค์—ˆ๋‹ค

    • ์ฝ”๋“œ๊ฐ€ ์ง๊ด€์ ์ด๊ณ  ๋””๋ฒ„๊น…์ด ์ƒ๋Œ€์ ์œผ๋กœ ์‰ฌ์šฐ๋ฉฐ ์ฝ”๋“œ ์ปค์Šคํ…€์ด ์‰ฝ๋‹ค

03 ๋จธ์‹ ๋Ÿฌ๋‹์˜ ์ •์˜์™€ ์ข…๋ฅ˜

๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ์ธ๊ณต์ง€๋Šฅ

  • ์ •์˜๋Š” ๋™์ผํ•˜์ง€๋งŒ ์‚ฌ์šฉํ•˜๋Š” ๋ถ„์•ผ๊ฐ€ ๋‹ค๋ฅด๋‹ค.

  • ๋จธ์‹ ๋Ÿฌ๋‹์€ ํ–‰๊ณผ ์—ด์ด ์กด์žฌํ•˜๋Š” ํ–‰๋ ฌ์„ ์ด์šฉํ•ด ์˜ˆ์ธก ๋˜๋Š” ๋ถ„๋ฅ˜๋ฅผ ํ•  ๋•Œ ์‚ฌ์šฉ

  • ์ด๋ฏธ์ง€์™€ ํ…์ŠคํŠธ ๊ฐ™์€ ์ •ํ˜•ํ™”๋˜์–ด ์žˆ์ง€ ์•Š์€ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ๋Š” ์ธ๊ณต์ง€๋Šฅ(๋”ฅ๋Ÿฌ๋‹)์„ ์‚ฌ์šฉํ•œ๋‹ค.

  • ํฌ๊ฒŒ ๋ณด๋ฉด ๋จธ์‹ ๋Ÿฌ๋‹์€ ์ธ๊ณต์ง€๋Šฅ ์•ˆ์— ํฌํ•จ๋˜๋Š” ๊ฐœ๋…์ด์ง€๋งŒ ๋Œ€์ค‘์—๊ฒŒ๋Š” ํ˜ผ์šฉํ•ด์„œ ์‚ฌ์šฉํ•œ๋‹ค.

๋จธ์‹ ๋Ÿฌ๋‹์˜ ์ข…๋ฅ˜

  • ๋ชจ๋ธํ•™์Šต

    • ํ•™์Šต ๋ชฉํ‘œ๋Š” ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๋ชจ๋ธ์˜ ๊ฒฐ๊ณผ๊ฐ€ ์ •๋‹ต์— ๊ฐ€๊น๊ฒŒ ๋‚˜์˜ค๋„๋ก ํ•™์Šต์‹œํ‚ค๋Š” ๊ฒƒ

  • ์†์‹ค ํ•จ์ˆ˜

    • ๋ชจ๋ธ์˜ ๊ฒฐ๊ณผ๊ฐ€ ์‹ค์ œ ์ •๋‹ต๊ณผ ์–ด๋–ค ์ฐจ์ด๊ฐ€ ์žˆ๋Š”์ง€ ์ˆ˜์น˜ํ™”ํ•  ํ•„์š”๊ฐ€ ์žˆ๋‹ค. ์ด ์ˆ˜์น˜ํ™”๋œ ์ฐจ์ด๋ฅผ ํ•จ์ˆ˜ํ™”ํ•œ ๊ฒƒ์„ ์†์‹ค ํ•จ์ˆ˜ ๋˜๋Š” ๋น„์šฉ ํ•จ์ˆ˜ ๋ผ๊ณ  ํ•œ๋‹ค.

    • ๋Œ€ํ‘œ์ ์œผ๋กœ๋Š” Mean Squared Error(MSE)๋ฅผ ๋“ค ์ˆ˜ ์žˆ๋‹ค.

๋จธ์„ ๋Ÿฌ๋‹์˜ ๊ตฌ๋ถ„

  • ์ง€๋„ ํ•™์Šต

    • X๋กœ Y๋ฅผ ์˜ˆ์ธกํ•˜๊ณ  ์‹ถ์„ ๋•Œ ์‚ฌ์šฉ

    • ๋จธ์‹ ๋Ÿฌ๋‹์„ ํ†ตํ•ด ๋งŒ๋“  ์˜ˆ์ธก ๋ชจ๋ธ f๋ฅผ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ ์ด๋ผ๊ณ  ํ•œ๋‹ค.

    • X๋Š” ๋…๋ฆฝ ๋ณ€์ˆ˜ ๋˜๋Š” Feature ๋ผ๊ณ  ํ•˜๋ฉฐ Y๋Š” ์ข…์† ๋ณ€์ˆ˜, ๋ฐ˜์‘ ๋ณ€์ˆ˜, ํƒ€๊นƒ ๋ณ€์ˆ˜ ๋ผ๊ณ  ํ•œ๋‹ค.

    • ํšŒ๊ท€๋ฌธ์ œ์™€ ๋ถ„๋ฅ˜๋ฌธ์ œ๊ฐ€ ์žˆ๋‹ค

  • ๋น„์ง€๋„ ํ•™์Šต

    • ์ง€๋„ํ•™์Šต์˜ ๋ฐ˜๋Œ€ ๊ฐœ๋…

    • X๋ณ€์ˆ˜๋งŒ ์กด์žฌํ•˜๋ฉฐ ๋ช…ํ™•ํ•œ ์ •๋‹ต์€ ์—†๋‹ค

    • ๋…๋ฆฝ ๋ณ€์ˆ˜๋งŒ์œผ๋กœ ์ƒˆ๋กœ์šด Feature๋ฅผ ์ฐพ์•„๋‚ด๊ฑฐ๋‚˜ ๊ตฐ์ง‘ํ™” ํ•˜์—ฌ ์ƒˆ๋กœ์šด ํŒจํ„ด์„ ์ฐพ์•„๋‚ด๋Š” ๊ฒƒ์— ์ดˆ์ ์„ ๋งž์ถ˜๋‹ค.

    • ๊ตฐ์ง‘ํ™”, ์ฐจ์› ์ถ•์†Œ๋ฒ• ๋“ฑ์ด ์žˆ๋‹ค.

  • ๊ฐ•ํ™” ํ•™์Šต

    • ์ƒํƒœ, ํ–‰๋™, ๋ณด์ƒ, ๋‹ค์Œ ์ƒํƒœ์˜ 4๊ฐ€์ง€ ๊ฐœ๋…์ด ์กด์žฌ

    • ์ˆ˜๋งŽ์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ†ตํ•ด ํ˜„์žฌ ์ƒํƒœ์—์„œ ์–ด๋–ค ํ–‰๋™์„ ์ทจํ•ด์•ผ ๋จผ ๋ฏธ๋ž˜์˜ ๋ณด์ƒ์„ ์ตœ๋Œ€๋กœ ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ํ•™์Šตํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜

์ง€๋„ํ•™์Šต ๋ชจ๋ธ์˜ ์ข…๋ฅ˜

  • ์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ

    • ๋…๋ฆฝ ๋ณ€์ˆ˜ ํ•˜๋‚˜๋งŒ์œผ๋กœ ์ข…์† ๋ณ€์ˆ˜๋ฅผ ์˜ˆ์ธก ํ•˜๋Š” ๋ชจ๋ธ์„ ๋‹จ์ˆœ ์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ์ด๋ผ๊ณ  ํ•œ๋‹ค

    • ๋ณ€์ˆ˜๊ฐ€ ์—ฌ๋Ÿฌ ๊ฐœ์ผ ๋•Œ ์ ํ•ฉ์‹œํ‚ค๋Š” ํšŒ๊ท€ ๋ชจ๋ธ์„ ๋‹ค์ค‘ ์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ์ด๋ผ๊ณ  ํ•œ๋‹ค.

  • ํšŒ๊ท€ ๊ณ„์ˆ˜ ์ถ•์†Œ ๋ชจ๋ธ

    • ๋ณ€์ˆ˜๊ฐ€ ๋„ˆ๋ฌด ๋งŽ์œผ๋ฉด ํ•™์Šต ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์„ฑ๋Šฅ์„ ๋†’์•„์ง€์ง€๋งŒ ๋น„ํ•™์Šต ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์„ฑ๋Šฅ์€ ๋‚ฎ์•„์ง„๋‹ค

    • ๊ฐ๊ฐ์˜ ๋ณ€์ˆ˜๊ฐ€ ์„œ๋กœ ์—ฐ๊ด€์„ฑ์ด ์žˆ์„ ๋•Œ ๋ณ€์ˆ˜์˜ ํ•ด์„๋ ฅ๋„ ๋‚ฎ์•„์ง„๋‹ค. (๋ณ€์ˆ˜์˜ ์˜ํ–ฅ๋ ฅ์ด ์ƒ๊ฐ๋ณด๋‹ค ์ž‘์•„์ง„๋‹ค๋Š” ์˜๋ฏธ)

    • ์ ์ ˆํ•œ ๋ณ€์ˆ˜๋งŒ ์„ ํƒํ•ด ๋ชจ๋ธ์— ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”. ์ด ๋ฌธ์ œ๋ฅผ ์™„ํ™”์‹œ์ผœ์ฃผ๋Š” ๋ฐฉ๋ฒ•์ด ํšŒ๊ท€ ๊ณ„์ˆ˜ ์ถ•์†Œ ๋ชจ๋ธ

    • Lasso : ํšŒ๊ท€๊ณ„์ˆ˜๊ฐ€ ์™„์ „ํžˆ 0์ด ๋˜๋„๋ก ์ถ•์†Œ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค

    • Ridge : ํšŒ๊ท€๊ณ„์ˆ˜๊ฐ€ 0์œผ๋กœ ๊ฐ€๊นŒ์›Œ์ง€๊ธด ํ•˜์ง€๋งŒ ์™„์ „ํžˆ 0์ด ๋˜์ง€ ์•Š๋Š”๋‹ค

    • ElasticNet : Lasso์™€ Ridge์˜ ์ค‘๊ฐ„ ๋ชจ๋ธ

  • ์˜์‚ฌ ๊ฒฐ์ • ๋‚˜๋ฌด

  • k-NN

    • ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด k๊ฐœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•ด ํ•ด๋‹น ๋ฐ์ดํ„ฐ์˜ ์ถœ๋ ฅ ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ์ง๊ด€์ ์ธ ๋ชจ๋ธ

    • k๋Š” ์‚ฌ์šฉ์ž๊ฐ€ ์‚ฌ์ „์— ์ง€์ •ํ•ด์•ผ ํ•˜๋Š” ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ๋ฐ์ดํ„ฐ ๊ฐ„ ๊ฑฐ๋ฆฌ ์ธก์ • ์ง€ํ‘œ๋‚˜ k๊ฐœ์˜ ๋ฐ์ดํ„ฐ์˜ ์ •๋ณด๋ฅผ ์ข…ํ•ฉํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์„ ํƒํ•ด ๋ชจ๋ธ์˜ ๋ณ€ํ™”๋ฅผ ์ค„ ์ˆ˜ ์žˆ๋‹ค

  • ์‹ ๊ฒฝ๋ง

    • ๋”ฅ๋Ÿฌ๋‹์˜ ๊ธฐ์ดˆ๊ฐ€ ๋˜๋Š” ๋ชจ๋ธ

    • ํ•™์Šต์— ์‚ฌ์šฉ๋œ ๋ฐ์ดํ„ฐ์—๋งŒ ์™„๋ฒฝํžˆ ์ ํ•ฉ๋˜๋Š” ๊ณผ์ ํ•ฉ ๋ฌธ์ œ ๋•Œ๋ฌธ์— ์˜ค๋žซ๋™์•ˆ ๋น›์„ ๋ฐœํœ˜ํ•˜์ง€ ๋ชปํ–ˆ๋‹ค

  • SVM

    • Support Vector Machine

    • ์‹ ๊ฒฝ๋ง์˜ ๊ณผ์ ํ•ฉ์— ๋Œ€ํ•œ ํ•ด๊ฒฐ์ฒต์„ ์ œ์‹œํ•œ ๋ชจ๋ธ

    • 2010๋…„๋Œ€ ์ดˆ๋ฐ˜๊นŒ์ง€ ๋„๋ฆฌ ์“ฐ์˜€์ง€๋งŒ ๋ณ€์ˆ˜๋‚˜ ๋ฐ์ดํ„ฐ ์ˆ˜๊ฐ€ ๋งŽ์•„์งˆ์ˆ˜๋ก ํ•™์Šตํ•˜๋Š” ์‹œ๊ฐ„์ด ๋งค์šฐ ์˜ค๋ž˜ ๊ฑธ๋ ค ์‚ฌ์šฉํ•˜์ง€ ์•Š์Œ

  • Ensemble Learning

    • ๋‹ค์–‘ํ•œ ๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด ์—ฌ๋Ÿฌ ๋ชจ๋ธ์— ๋Œ€ํ•ด์„œ ๊ฐ€์žฅ ์ข‹์€ ์˜ˆ์ธก ๊ฐ’์„ ์„ ์ •

    • ๋ฐ์ดํ„ฐ๋ฅผ ์žฌ๊ตฌ์„ฑํ•ด ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” Bagging

    • ๋ฐ์ดํ„ฐ์™€ ๋ณ€์ˆ˜๋ฅผ ๋žœ๋ค์œผ๋กœ ์ถ”์ถœํ•ด ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” RandomForest

    • ์ž˜ ๋งž์ถ”์ง€ ๋ชปํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ข€ ๋” ์ง‘์ค‘์ ์œผ๋กœ ํ•™์Šต์‹œํ‚ค๋Š” Boosting(์ผ๋ฐ˜์ ์œผ๋กœ ๋งŽ์ด ์“ฐ์ž„)

    • ์—ฌ๋Ÿฌ ๋ชจ๋ธ์˜ ์˜ˆ์ธก ๊ฐ’์„ ๋‹ค์‹œ ๋…๋ฆฝ ๋ณ€์ˆ˜๋กœ ํ™œ์šฉํ•˜๋Š” Stacking(์‹œ๊ฐ„์ด ์˜ค๋ž˜ ๊ฑธ๋ ค ์ž˜ ์“ฐ์ด์ง€ ์•Š์Œ)

04 ๊ณผ์ ํ•ฉ

๊ณผ์ ํ•ฉ์ด ๋ฐœ์ƒํ•˜๋Š” ์›์ธ

  • ๋ณธ์งˆ์ ์ธ ๋ฌธ์ œ : ์ƒ˜ํ”Œ ๋ฐ์ดํ„ฐ(ํ‘œ๋ณธ)๋งŒ ๊ฐ€์ง€๊ณ  ์ „์ฒด ๋ฐ์ดํ„ฐ(๋ชจ์ง‘๋‹จ)๋ฅผ ์˜ˆ์ธกํ•˜๋ ค๊ณ  ํ•˜๊ธฐ ๋•Œ๋ฌธ

  • ํ•™์Šตํ•  ์ƒ˜ํ”Œ ๋ฐ์ดํ„ฐ ์ˆ˜์˜ ๋ถ€์กฑ

  • ํ’€๊ณ ์ž ํ•˜๋Š” ๋ฌธ์ œ์— ๋น„ํ•ด ๋ณต์žกํ•œ ๋ชจ๋ธ์„ ์ ์šฉ

  • ์ ํ•ฉ์„ฑ ํ‰๊ฐ€ ๋ฐ ์‹คํ—˜ ์„ค๊ณ„

    • ๊ฐ–๊ณ  ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ ์ ˆํžˆ ํ•™์Šต ๋ฐ์ดํ„ฐ์™€ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ๋กœ ๋ถ„ํ• 

    • ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ๋ชจ๋ธ์„ ํ•™์Šตํ•œ ํ›„ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ์— ๋ชจ๋ธ์„ ์ ์šฉ์‹œ์ผœ ๊ณผ์ ํ•ฉ ์—ฌ๋ถ€๋ฅผ ํŒ๋‹จ

    • ๋ฐ์ดํ„ฐ ์ˆ˜๊ฐ€ ์ ์„ ๋•Œ๋Š” ๊ฒ€์ฆ๋ฐ์ดํ„ฐ์™€ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ ํ• ๋‹น์ด ๋ถ€๋‹ด์Šค๋Ÿฌ์šธ ์ˆ˜ ์žˆ๋‹ค. ์ด ๋•Œ๋Š” K-Fold Croos Validation ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•œ๋‹ค.

      • ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ K๊ฐœ๋กœ ๋ถ„ํ•  ํ•ด ๊ฐ ๋ฐ์ดํ„ฐ๋งˆ๋‹ค 1๋ฒˆ์„ ๊ฒ€์ฆ, K-1๋ฒˆ์„ ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ์‚ฌ์šฉํ•˜์—ฌ ํ‰๊ท ์ ์ธ ์„ฑ๋Šฅ์„ ์ธก์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•

[AI ์Šค์ฟจ 1๊ธฐ] 9์ฃผ์ฐจ DAY 5

Big Data : ML Pipeline๊ณผ Tuning ์†Œ๊ฐœ

Spark MLlib ๋ชจ๋ธ ํŠœ๋‹

  • ์ตœ์ ์˜ ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ ์„ ํƒ

    • ๋ชจ๋ธ ๋ฐ–์— ์žˆ๋Š” ์ธ์ž๋ฅผ ์˜๋ฏธ

    • ํ•˜๋‚˜์”ฉ ํ…Œ์ŠคํŠธ ํ•˜๊ธฐ vs ๋‹ค์ˆ˜๋ฅผ ๋™์‹œ์— ํ…Œ์ŠคํŠธ ํ•˜๊ธฐ

  • ๋ชจ๋ธ ํ…Œ์ŠคํŠธ ๋ฐฉ๋ฒ•

    • ๊ต์ฐจ ๊ฒ€์ฆ

    • ํ›ˆ๋ จ/ํ…Œ์ŠคํŠธ์…‹ ๋‚˜๋ˆ„๊ธฐ

Spark MLlib ๋ชจ๋ธ ํ…Œ์ŠคํŠธ

  • ํ›ˆ๋ จ์šฉ๊ณผ ํ…Œ์ŠคํŠธ์šฉ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ํ…Œ์ŠคํŠธ

    • ํ™€๋“œ์•„์›ƒ ํ…Œ์ŠคํŠธ๋ผ๊ณ  ํ•˜๊ธฐ๋„ ํ•จ

    • 80 : 20 ๋˜๋Š” 75 : 25๋กœ ๋‚˜๋ˆˆ๋‹ค

  • ๊ต์ฐจ๋ถ„์„ ํ…Œ์ŠคํŠธ

    • K-Fold ํ…Œ์ŠคํŠธ ๋ผ๊ณ  ๋ถ€๋ฅด๊ธฐ๋„ ํ•จ

  • ๋ชจ๋ธ ์„ ํƒ์‹œ ์ž…๋ ฅ

    • Estimator

      • ๋จธ์‹  ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‚˜ ๋ชจ๋ธ ๋น™๋”ฉ ํŒŒ์ดํ”„๋ผ์ธ

    • Evaluator

Big Data : ๋ฒ”์šฉ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ ํŒŒ์ผ ํฌ๋งท : PMML

๋‹ค์–‘ํ•œ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ฐœ๋ฐœ ํ”Œ๋žซํผ

  • Scikit-Learn, PyTorch, Tensorflow, Spark MLlib

  • ํ†ต์šฉ๋˜๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ํŒŒ์ผํฌ๋งท์ด ํ•„์š”

    • PMML, MLeap์ด ๋Œ€ํ‘œ์ 

  • ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ ์„œ๋น™ํ™˜๊ฒฝ์˜ ํ†ต์ผ์ด ๊ฐ€๋Šฅ

    • ์‹ค์ œ๋กœ๋Š” ์ง€์› ๊ธฐ๋Šฅ์ด ๋ฏธ์•ฝํ•ด์„œ ๋ณต์žกํ•œ ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ์—๋Š” ์ง€์›๋ถˆ๊ฐ€

PMML

  • Predictive Model Markup Language

  • ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ๋งˆํฌ์—… ์–ธ์–ด๋กœ ํ‘œํ˜„ํ•ด์ฃผ๋Š” XML ์–ธ์–ด

  • ์ ˆ์ฐจ

    1. ML Pipeline์„ PMML ํŒŒ์ผ๋กœ ์ €์žฅ

      • pyspark2pmml ํŒŒ์ด์ฌ ๋ชจ๋“ˆ์ด ํ•„์š”

    2. PMML ํŒŒ์ผ์„๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ๋ธ ์˜ˆ์ธก API๋กœ ๋ก ์น˜

    3. ์ด API๋กœ ์ •๋ณด๋ฅผ ๋ณด๋‚ด๊ณ  ์˜ˆ์ธก ๊ฒฐ๊ณผ๋ฅผ ๋ฐ›๋Š” ํด๋ผ์ด์–ธํŠธ ์ฝ”๋“œ ์ž‘์„ฑ

Big Data : ์ด์ •๋ฆฌ

Spark

  • ์ฐจ์„ธ๋Œ€ ๋ถ„์‚ฐ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ํ”„๋ ˆ์ž„์›Œํฌ

  • ์ •๋ง ๋ฐ์ดํ„ฐ๊ฐ€ ํด ๋•Œ ์‚ฌ์šฉ

๋ฐ์ดํ„ฐ ํŒ€์˜ ๋ฐœ์ „

  • ์„œ๋น„์Šค์—์„œ ์ง์ ‘ ์ƒ๊ธฐ๋Š” ๋ฐ์ดํ„ฐ์™€ ์จ๋“œํŒŒํ‹ฐ๋ฅผ ํ†ตํ•ด ์ƒ๊ธฐ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค์— ์ €์žฅ

  • ๋ฐ์ดํ„ฐ ๋ถ„์„ => ์ง€ํ‘œ ์ •์˜, ์‹œ๊ฐํ™”

  • ๋ฐ์ดํ„ฐ ๊ณผํ•™ ์ ์šฉ

Last updated

Was this helpful?