31 Wed

GARIGO : Face Mosaic Project

다중 사진 학습 vs 단일 사진 학습

  • 당연히 한 사진보다 여러 사진을 학습하는 것이 큰 도움이 될 거라고 생각했는데, 생각보다 큰 성능이 나오지는 않았다. 조금 더 잘잡을 때가 있고, 또 못잡을 때가 생겼기 때문이다.

    • 그리고 한 장만 사용하더라도 굉장히 준수한 성능이 나온다.

  • 한 인물에 대해서 좀 더 심층적으로 학습할 필요가 있다고 느꼈다.

    • 결국 이로 인해 svm 이나 knn 알고리즘으로 학습할 시도가 이루어졌다.

    • 이는 후에 다시 다룬다.

  • 당연히 사진이 k배 많아지면 시간도 k배 증가하겠지만 워낙 한장당 location + encoding 하는 체감시간이 짧아서, 1장과 10장을 비교하면 시간에 대한 큰 차이는 없다. 한 30장 이상정도부터 체감 상 차이가 날 것 이다.

    • 단 location과 encoding 과정에서 upsample 횟수와 jitter 횟수에 따라 또 다르다.

  • 프로젝트에서는 5-10장 정도를 사용했다.

    • 모델에서 다중 비교를 제공하지 않아서 반복문을 통해 과반수 비율로 구현했다. 예를 들어 10장 중 6장이 맞다고 하면 동일 인물로 판단하도록. 과반수의 기준은 절반 이상으로 정하지는 않았고 threshold를 0.6으로 정했다. (0.55일 경우는 반려된다는 이야기)

Last updated

Was this helpful?