2023년 한국정보과학회에서 실시한 한국컴퓨터종합학술대회(KCC 2023)의 연구 논문이다.
논문 제목: C-Swin UNETR: 3D 의료 영상 분할을 위한 채널 어텐션이 적용된 Swin Transformer
논문 저자: 안성현 · 김환희 · 권세인 · 박상현(연세대)
상태: Accepted (Oral Session)
정보: Korea Computer Congress 2023, 제주도, June 17, 2023 ~ June 20, 2023
학술정보 포털: [DBpia]
요약
의료 영상 분할(Medical Image Segmentation)이란 CT나 MRI와 같은 영상에서 종양과 같은 병변이나 다양한 장기를 구별하는 기술이다. 의료 영상 분할 연구는 U-Net을 기반으로 하며, 모델은 크게 인코더와 디코더로 구성된다. 인코더는 입력 영상의 다양한 스케일에 대한 문맥 정보를 파악하고, 디코더는 다양한 스케일의 문맥 정보를 융합하여 영상 분할 맵을 생성한다. 그러나 U-Net 기반 모델들은 인코더 구조에서 채널 수의 증가에도 불구하고 공간적 특징에만 초점을 맞추었다. 따라서 우리는 유용한 공간 정보 및 채널 정보를 모두 활용하는 C-Swin UNETR을 제안한다. 제안하는 방법론을 검증하기 위해 Synapse 데이터셋을 통해 기존의 모델과 비교 실험을 진행하였으며, 제안하는 방법론의 우수성을 검증하였다.
논문 및 발표 자료
참고자료
- U-Net: Convolutional networks for biomedical image sementation
: https://arxiv.org/pdf/1505.04597.pdf - Swin transformer: Hierarchical vision transformer using shifted windows
: https://arxiv.org/pdf/2103.14030.pdf - Self-supervised pre-training of swin transformers for 3d medical image analysis
: https://arxiv.org/pdf/2111.14791.pdf - Miccai multi-atlas labeling beyond the cranial vault–workshop and challenge
: https://www.synapse.org/#!Synapse:syn3193805/wiki/89480 - nnformer: Interleaved transformer for volumetric segmentation
: https://arxiv.org/pdf/2109.03201.pdf