Overview
Contents
Overview#
Introduction#
Instance segmentation은 입력 영상에 존재하는 객체(instance)의 정보를 반영한 pixel level classification 방법으로, 각 pixel이 속한 객체 label 및 객체의 classes를 추정하는 방법이다.
semantic segmentation과 같이 pixel-level의 classification으로 정의되는 것은 동일하지만, 같은 class에 속하더라도 객체별로 다른 label을 가져야 하기 때문에 위치 정보가 반영된 inference가 추가적으로 필요하다.
따라서 object detection을 통해 얻은 bounding box 내의 segmentation을 수행하는 방법이 주로 적용되어, 일반적으로 instance segmentation은 배경을 제외한 객체(instance)의 영역에 대해서 class와 label을 예측한다.
Performance Measure#
Instance segmentation 성능평가를 위해 주로 적용되는 measure는 COCO banchmark의 평가지표로 사용되는 \(\text{mask}\ AP\)(average precision)으로 instance의 ground truth mask와 prediction된 mask의 IoU threshold를 0.50에서 0.05단위로 0.95까지 설정하여 구한 precision의 평균으로 구한다. COCO style의 mAP(mean AP)는 다음과 같이 계산할 수 있다.
\[mAP=\frac{1}{C} \sum_{c \in C}\frac{|TP_c|}{|FP_c|+|TP_c|}\]여기서 \(TP\)는 true positive, \(FP\)는 false positive를 나타내며, \(C\)는 ground truth의 class 수이다.
IoU threshold가 0.5 (50%)인 값을 \(AP_{50}\)으로, threshold가 0.7 (70%) 일 때는 \(AP_{70}\)으로 표현한다.
Trend#
Reference#
Latest update: Nov. 9, 2022