23 Tue
Last updated
Was this helpful?
Last updated
Was this helpful?
Object Detection ๋ฌธ์ ์ ์
Classification : ์ด ์์์ ์๋์ฐจ ์์์ผ ํ๋ฅ ์ด ๊ฐ์ฅ ๋๋ค
Classification + Localization : ์ด ์์์ ์๋์ฐจ ์์์ผ ํ๋ฅ ์ด ๊ฐ์ฅ ๋๊ณ ์ด ์๋์ฐจ๋ ์ด ์์น์ฏค ์๋ค
Object Detection : ์์์์ ์๋ ๋ชจ๋ ๋ฌผ์ฒด๋ค๊ณผ ๊ทธ๊ฒ๋ค์ ์์น ์์ญ์ ํจ๊ป ์ฐพ๋๋ค
์๋๋ก ๊ฐ์๋ก ๋์ด๋๊ฐ ์ด๋ ค์. ํนํ Object Detection ๊ฐ์ ๊ฒฝ์ฐ๋ ๋ช ๊ฐ์ object๊ฐ ์กด์ฌํ๋์ง ์ ์ ์๊ธฐ ๋๋ฌธ
[๋ฌผ์ฒด์ ์กด์ฌ, ์ค์ฌ์ ์ x์ขํ, ์ค์ฌ์ ์ y์ขํ, ๋ฌผ์ฒด์ ๋๋น, ๋ฌผ์ฒด์ ๋์ด] + [class]
object๋ณ๋ก ๋ฒกํฐ๊ฐ ํ๋์ฉ ํ์ํ๋ค
์ด๋ ์์น์ Object๊ฐ ์๋์ง ์ฐพ์์ผํจ
Object์ ์์ญ๊ณผ ํฌ๊ธฐ๋ ๊ฒฐ์
Object๋ฅผ ๋ถ๋ฅํด์ผํจ
Object Detection ์์ ๊ธฐ์
Region Proposal : Object๊ฐ ์์๋งํ ์์ญ์ ๋ค์ ์ถ์ฒ
๋ชจ๋ ์์ญ์ ๋ณผ ์๊ฐ ์์ผ๋ฏ๋ก ์์๋งํ ์์ญ์ ์ถ์ฒ๋ฐ์
Non-max Suppression : ๊ฒน์น๋ ์์ญ์ ์ ๊ฑฐ
Classification : ์์ญ์์ object๋ฅผ ๋ถ๋ฅ
Bounding Box Regression : Object์์ญ์ ๋ฏธ์ธ์กฐ์
Faster RCNN ๊ธฐ๋ณธ flow
RCNN -> Fast RCNN -> Faster RCNN
์ด๊ธฐ์ Pre-trained๋ CNN์ ํต๊ณผ์์ผ Feature map์ ์ป๋๋ค
Base Network๋ผ๊ณ ๋ ๋ถ๋ฆ
์ป์ feature map์ ํตํด region proposal์ ์ฐธ๊ณ ํ์ฌ ์ป์ด์ง region์ ๊ฐ์ง๊ณ ์ ๋ ฅ๋ฒกํฐ๋ก ์ค์ ํ๋ค
IoU measure
Intersection over Union
IoU = ๊ต์งํฉ / ํฉ์งํฉ
Objectness๋ฒกํฐ
2๊ฐ๋ก ๊ตฌ์ฑ
1๊ฐ๋ Object์ผ ํ๋ฅ , ๋ค๋ฅธ 1๊ฐ๋ Object๊ฐ ์๋ ํ๋ฅ
Ground Truth
์ฌ๋์ด ๋ผ๋ฒจ๋ง ํ ์ ๋ณด. ์ค์ฌ์ , ์์น, ๋๋น ๋ฑ
Ground Truth์ object์์ญ์ IoU๋ฅผ ๊ณ์ฐํ์ฌ threshold๋ณด๋ค ํฌ๋ฉด object ์์ญ์ด๋ผ๊ณ ํ๋จ
์ค์ ๋ก Ground Truth๊ฐ ๋๋ฌด ํด ๊ฒฝ์ฐ object ์์ญ์ด ์๋๋ผ๊ณ ํ๋จํ ๊ฐ๋ฅ์ฑ์ด ๋์(์ค์ ๋ก๋ ๋ง์ง๋ง)
๊ทธ๋ ๋ค๋ฉด, ๊ต์งํฉ์ผ๋ก๋ง ํ๋จํ๋ฉด ๋์ง ์๋๊ฐ?
object์์ญ์ ์ฐพ๊ธฐ๋ ์ฌ์์ง๋ค
๊ทธ๋ฌ๋ Box Boundary Regressor๊ฐ ํ ์ผ์ด ์ด๋ ค์์ง
Box Boundary Regressor
object์ ๊ฒฝ๊ณ์์์ ์ขํ๋ฅผ ์ฐพ๋ ์ผ์ ํจ
Bounding Box Regressor
์ด์ ์ ๋งํ๋ [๋์ด, ๋๋น, x ์ค์ฌ์ , y์ค์ฌ์ ] ์ด ์๋๋ผ ์ค์ ๋ก๋ [์ ๋์ด / ์ ์ฒด๋์ด, ์ ๋๋น / ์ ์ฒด๋๋น, x์ค์ฌ์ ์ผ๋ก๋ถํฐ ๋ฒ์ด๋ ํฌ๊ธฐ, y์ค์ฌ์ ์ผ๋ก๋ถํฐ ๋ฒ์ด๋ ํฌ๊ธฐ] ๋ฅผ ๋ค๋ฃฌ๋ค
anchor box๊ฐ ์๋ค๋ฉด?
๊ฐ ์ ๊ฐ์ ํ๋ผ๋ฏธํฐ ๊ฐ์ด ์๋ก ๋ฌ๋ผ์ ํ์ต์ด ๋๊ธฐ ์ด๋ ค์
object์ ์ผ๋ถ๋ถ๋ง์ object๋ผ๊ณ ํ๋จํ๋ค. => ์ ํ์ต๋์๋ค๊ณ ํ ์๋ ์๋ค.
Anchor Box
๋ฏธ๋ฆฌ ์ ํด์ง ํฌ๊ธฐ์ ๋น์จ์ ๊ฐ์ง ์ ์๋ ํ๋ณด box
๊ฐ box์ ํฌ๊ธฐ๋ ์ ํ๊ธฐ ๋๋ฆ์ด๋ฉฐ ์ฃผ๋ก ๋ฐฐ์๋ฅผ ํด์ ํฌ๊ธฐ๋ฅผ ์ฆ๊ฐ์ํจ๋ค. => ์ด๋ค๊ฒ์ด ํจ์จ์ ์ธ์ง๋ ์์ง ์ฐ๊ตฌ ์ค
๊ฐ์ฅ ์์ box๋ฅผ IoU์ ๋น๊ตํด์ object๋ฅผ ํ๋จ
non-object๋ก ํ๋จ๋๋ฉด ๋ ํฐ box์ ๋น๊ต. ์ด ๊ณผ์ ์ ๋ฐ๋ณต
์ด ํ ํ๋จ ๋ ๊ฒฝ์ฐ ๋ฉ์ถค
BAB : Background Anchor Box
OAB : Object Anchor Box
์ด ํ ๋ชจ๋ Anchor box์ BAB/OAB ๊ฒฐ๊ณผ๋ฅผ ํ๋์ ๋ฒกํฐ๋ก ๋ง๋ ๋ค.
ํด๋น ์์น์ ๋ํด์๋ N * M ์ฌ์ด์ฆ์ AB ๋ฐ์ค๋ Object๋ก ํ๋ณํ ์ ์๋ค๋ ์๋ฏธ ์ ๋ฌ
๊ธธ์ด๋ 2 x K
๊ฐ ์์น๋ง๋ค ์ด ๋ฒกํฐ๊ฐ ์กด์ฌํ๋ฏ๋ก image size * k ๊ฐ์ outpu t