객체탐지 2

동영상 객체 탐지 및 추적 딥러닝 기술

동영상 객체 인식을 위한 딥러닝 기술은 정지된 이미지를 분석하는 것을 넘어, 시간의 흐름과 객체의 움직임을 함께 고려해야 하는 복잡한 분야입니다. 핵심은 시간적 일관성(Temporal Coherency)을 어떻게 모델에 통합하느냐에 있습니다. 동영상 속 객체는 프레임마다 조금씩 움직이며, 때로는 다른 객체에 가려지거나(occlusion) 프레임 밖으로 나갔다가 다시 돌아오기도 합니다. 동영상 객체 인식을 수행하는 딥러닝 기술은 크게 '탐지(Detection)'와 '추적(Tracking)'이라는 두 가지 주요 작업으로 나뉩니다.1. 동영상 객체 탐지 (Video Object Detection, VOD) VOD는 비디오의 모든 프레임에서 객체의 위치와 종류를 식별하는 작업입니다.(1) 프레임별 탐지 (Fra..

mAP(mean Average Precision)

mAP(mean Average Precision)는 객체 탐지(Object Detection) 모델의 성능을 평가하는 가장 표준적이고 중요한 지표입니다. 간단히 말해, 모델이 이미지 내의 여러 객체들을 '얼마나 정확하게(Precision)' 그리고 '얼마나 빠짐없이(Recall)' 찾아내는지를 하나의 숫자로 요약한 값입니다. mAP를 이해하기 위해서는 네 가지 구성 요소(IoU, Precision/Recall, AP, mAP)를 순서대로 이해해야 합니다.1. IoU (Intersection over Union) 가장 기본이 되는 개념입니다. 모델이 예측한 박스(Predicted Box)가 실제 정답 박스(Ground Truth Box)와 얼마나 겹치는지를 측정합니다.계산식: 두 박스의 교집합 영역을 합집..