22 Mon

[AI ์Šค์ฟจ 1๊ธฐ] 11์ฃผ์ฐจ DAY 1

Visual Recognition

Visual Recognition

  • ์นด๋ฉ”๋ผ๋ฅผ ํ†ตํ•ด ์ทจ๋“๋˜๋Š” ์‚ฌ์ง„์ด๋‚˜ ๋™์˜์ƒ์—์„œ ์ •๋ณด๋ฅผ ์ทจ๋“ํ•˜๋Š” ๊ณผ์ •

๋”ฅ๋Ÿฌ๋‹

  • ๋”ฅ ๋‰ด๋Ÿด ๋„คํŠธ์›Œํฌ๋ฅผ ํ†ตํ•ด ํ•™์Šตํ•˜๋Š” ๊ฒƒ

    • ๋ ˆ์ด์–ด์˜ ๊ฐœ์ˆ˜๊ฐ€ 3๊ฐœ ์ดํ•˜์ผ ๊ฒฝ์šฐ ์–•์€์ธต ์‹ ๊ฒฝ๋ง

    • ๋ ˆ์ด์–ด์˜ ๊ฐœ์ˆ˜๊ฐ€ 3๊ฐœ ์ด์ƒ์ผ ๊ฒฝ์šฐ ๊นŠ์€ ์‹ ๊ฒฝ๋ง

๋น„์„ ํ˜• ํ•จ์ˆ˜์˜ ํ•„์š”์„ฑ

  • ์•„๋ฌด๋ฆฌ ์ธต์„ ๊นŠ๊ฒŒ ํ•ด๋„ ์„ ํ˜•ํ•จ์ˆ˜๋กœ๋Š” ๊นŠ๊ฒŒ ๋งŒ๋“ค ์ˆ˜ ์—†๋‹ค

    • a(3)=W(2)aa(2)=W(2)W(1)x=Wx a^{(3)} = W^{(2)}a a^{(2)} = W^{(2)}W^{(1)}x = Wx

    • 2๊ฐœ์˜ ํ–‰๋ ฌ๋กœ ํ‘œํ˜„๋˜๋Š” NN์ด 1๊ฐœ์˜ ํ–‰๋ ฌ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์Œ

์ธ์‹์˜ ๋ฌธ์ œ

  • ๋ถ„๋ฅ˜์˜ ๋ฌธ์ œ์™€ ๋™์ผ

  • ์Œ์„ฑ์ธ์‹๊ณผ ์˜์ƒ์ธ์‹์€ ๊ทผ๋ณธ์ ์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ฌธ์ œ๋กœ ๊ฐ™์€ ๋งฅ๋ฝ

CNN

  • ์™„์ „ ์—ฐ๊ฒฐ ๋˜์–ด ์žˆ์ง€ ์•Š์Œ => Not fully connected

  • ๊ฐ ์ธต๋งˆ๋‹ค ๊ฐ€์ค‘์น˜ ํ–‰๋ ฌ์ด ๊ฐ™๋‹ค๋ฉด ํ•„ํ„ฐ๋ฅผ ์ ์šฉํ•˜๋Š” ๊ฒƒ์€ ๋ถ€๋ถ„ ์—ฐ๊ฒฐ๋กœ ์‹ ๊ฒฝ๋ง์„ ๊ตฌ์„ฑํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Œ

Mutl-channel Convolution

  • output ์ฑ„๋„์˜ ๊ฐœ์ˆ˜ = ํ•„ํ„ฐ์˜ ๊ฐœ์ˆ˜

  • input : [batch, in_height, in_width, in_channels]

  • filter : [filter_height, filter_width, in_channels, out_channels]

Pooling์˜ ํšจ๊ณผ

  • ๋ฏธ์„ธํ•œ ๋ณ€ํ™”์— ๋Œ€ํ•ด ๋‘”๊ฐํ•˜๊ฒŒ ํ•จ

CNN์˜ ๊ตฌ์กฐ

  • ์ธํ’‹ -> Conv/ReLU/Pooling -> ... -> FC -> classification

์ „์ดํ•™์Šต์˜ ํ•„์š”์„ฑ

  • transfer learning

  • ๋”ฅ๋Ÿฌ๋‹์˜ ๋‹จ์ 

    • ๋ง‰๋Œ€ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์–ด์•ผ ํ•จ

    • ๋ฐ์ดํ„ฐ๊ฐ€ ์–‘์งˆ์˜ ๋ฐ์ดํ„ฐ์—ฌ์•ผ ํ•จ

    • ์ผ๋ฐ˜์ธ์ด๋‚˜ ์ค‘์†Œ๊ธฐ์—…์€ ๋ฐ์ดํ„ฐ ํ™•๋ณด๊ฐ€ ์–ด๋ ค์›€

    • ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•œ ์ปดํ“จํŒ… ํŒŒ์›Œ๊ฐ€ ๊ฐ–์ถฐ์ ธ์•ผ ํ•จ

  • ์œ ํ˜•

    • ์‚ฌ์ „ํ•™์Šต ๋ชจ๋ธ์„ ๊ทธ๋Œ€๋กœ ์‚ฌ์šฉ

      • ๋ฌธ์ œ๊ฐ€ ๊ฑฐ์˜ ๊ฐ™์„ ๋•Œ ์‚ฌ์šฉ

      • ImageNet(50๊ฐœ์˜ ์œ ํ˜•(๊ฐœ, ๋ง ํฌํ•จ)์„ ๊ตฌ๋ถ„ํ•˜๋Š” ๋ชจ๋ธ)์„ ๊ฐœ์™€ ๋ง์„ ๊ตฌ๋ถ„ํ•˜๋Š” ๋ชจ๋ธ์— ์‚ฌ์šฉ

    • ๋ชจ๋ธ ๋ถ„๋ฅ˜๊ธฐ๋งŒ ์žฌํ•™์Šต

      • ImageNet ๋ฐ์ดํ„ฐ๋กœ ์–ด๋ฒค์ ธ์Šค ์บ๋ฆญํ„ฐ ๋ถ„๋ฅ˜ ๋ฌธ์ œ์— ์‚ฌ์šฉ

    • ๋ชจ๋ธ์˜ ์ผ๋ถ€๋ฅผ ๋™๊ฒฐํ•ด์ œํ•˜์—ฌ ์žฌํ•™์Šต

      • ๋ฌธ์ œ๊ฐ€ ์•ฝ๊ฐ„ ๋‹ค๋ฅผ ๋•Œ ์‚ฌ์šฉ

      • ImageNet๋ฐ์ดํ„ฐ๋กœ ์–ผ๊ตด์ธ์‹ ๋ฌธ์ œ์— ์‚ฌ์šฉ

      • ์‚ฌ๋žŒ์€ ์ธ์‹ํ•˜์ง€๋งŒ ์‚ฌ๋žŒ ์–ผ๊ตด์„ ๋ถ„๋ฅ˜ํ•˜๋Š”๋ฐ๋Š” ์“ฐ์ด์ง€ ์•Š๋Š” ์ฐจ์ด๊ฐ€ ์žˆ์Œ

    • ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ ์ „์ฒด๋ฅผ ๋ฏธ์„ธ์กฐ์ •

      • ๋ฌธ์ œ๊ฐ€ ๋งŽ์ด ๋‹ค๋ฅผ ๋•Œ ์‚ฌ์šฉ

      • ImageNet๋ฐ์ดํ„ฐ๋กœ ํ•™์Šต๋œ ๋ชจ๋ธ์„ ์˜๋ฃŒ์˜์ƒ ๋ฌธ์ œ์— ์‚ฌ์šฉ

      • ๋น„๋ก ๋ชจ๋ธ ์ „์ฒด๋ฅผ ์ˆ˜์ •ํ•˜์ง€๋งŒ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ๊ฒƒ์ด ํฌ์ธํŠธ

        • ์ฒ˜์Œ๋ถ€ํ„ฐ ํ•˜๋Š”๊ฒŒ ์•„๋‹ˆ๋ผ ์–ด๋А ์ •๋„ ํ•™์Šต๋œ ์ƒํƒœ์—์„œ ํ•˜๋Š”๊ฒƒ์ด ๋ชฉํ‘œ

        • ์‹œ๊ฐ„ ๋‹จ์ถ•. ๊ทธ๋ฆฌ๊ณ  ์–ด์ฉŒ๋ฉด์€ ๋” ์ •ํ™•ํ•˜๊ฒŒ ์ฐพ์„ ์ˆ˜ ์žˆ์Œ

        • ๋ฐฉ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ•˜์ง€ ์•Š์„ ์ˆ˜๋„ ์žˆ์Œ

Last updated

Was this helpful?