2022년 한국정보과학회에서 실시한 한국소프트웨어종합학술대회(KSC 2022)의 연구 논문이다.
논문 제목: 다중 객체 비디오에서의 어텐션 기반 단일 객체 추적 모델 연구
논문 저자: 안성현(가톨릭대), 조영완 · 박상현(연세대)
상태: Accepted (Oral Session)
정보: Korea Software Congress 2022, 제주도, December 20, 2022 ~ December 23, 2022
학술정보 포털: [DBpia]
요약
단일 객체 추적(Single Object Tracking)이란 비디오에서 선택된 객체를 추적하는 기술이다. 단일 객체 추적 연구는 Fully Convolutional Siamese Network (Siam FC)를 기반으로 하며, 모델은 크게 세 가지 네트워크로 구성된다. 먼저 특징 추출기는 추적 대상을 포함하는 템플릿 영상과 추적 대상을 찾을 검색 영상의 특징을 각각 추출한다. 이후 특징 융합 네트워크는 추출된 특징에 대한 유사도를 계산하고, 예측-헤드 네트워크는 가장 높은 유사도를 통해 검색 영상에서 추적 대상의 위치를 예측한다. 그러나 유사도를 이용한 객체 추적 방식은 여러 객체들이 동시에 움직이는 비디오에서 잘못된 객체를 추적할 수 있다는 문제점이 있다. 따라서 우리는 정확한 추적 대상 탐지를 위해 특징 추출기와 예측-헤드 네트워크에서 어텐션 모듈을 적용하는 방식을 제안한다. 제안하는 방법론을 검증하기 위해 GOT-10k 데이터셋에 대해 기존의 모델과 비교 실험을 진행하였으며, 제안하는 방법론의 우수성을 검증하였다.
논문 및 발표 자료
참고자료
- Transformer Tracking
https://arxiv.org/pdf/2103.15436.pdf - Fully convolutional Siamese networks for object tracking
https://arxiv.org/pdf/1606.09549.pdf - CBAM: Convolutional block attention module
https://arxiv.org/pdf/1807.06521.pdf - GOT-10k: A Large High-Diversity Benchmark for Generic Object Tracking in the Wild
https://arxiv.org/pdf/1810.11981.pdf