프로젝트/Place-Recognition
Triplet Loss
Mujae98
2024. 6. 28. 13:03
컴퓨터 비전에서 class를 분류할 때 데이터셋에 포함된 class만을 분류하는 경우가 많지만
실생활에서는 새로운 class들이 많으며 새로운 이미지가 어떤 이미지와 같은지 다른지를 구분해야 하는 경우가 있다.
또한 그들이 얼마나 비슷한지(유사도) 알아야 하는 경우가 많은데 이때 필요한 것이 Metric learing이다.
metric: 메트릭은 집합의 모든 요소 쌍 사이의 거리를 정량화하여 유사성 측정을 포함하는 함수
metric은 크게 두 가지로 나뉨.
- cos유사도나 l2 distance 같은 pre-defind distance
- mahalanobis 같은 데이터로 부터 배우는 learned metric
- Unsupervise (unlabeled)
- Supervise
triplet loss는 metric을 어떻게 학습시킬거냐에 대한 함수이고, 보통? l2 distance metric를 활용함.
triplet loss의 경우 아래의 그림으로 모두 설명이 된다.
Anchor이미지와 Positive 이미지 간의 거리(유사도)는 가깝게 하고, Negative 이미지와의 거리는 크게 만드는 것이다.
식은 아래와 같다.
L=max(d(a,p)−d(a,n)+margin,0)
예시로 margin이 1이면 negative는 1이상, positive는 1 이하로 되도록 학습 되는 것이다.