[Computer Vision]딥러닝 성능최적화(1) : 자기지도학습(Self-Supervised Learning)과 설명가능한 AI(Explainable AI)
Self-supervised learning(자기 지도 학습)
자기 지도 학습은 언제 적용 가능할까요?
데이터는 많은데 Label이 제한 된 경우
제한된 데이터에서 최대한의 정보를 추출하는 경우
사실 위 두 조건은 거의 모든 상황에서 만족합니다.
1.데이터가 많은 경우
예시: Tesla
현재 Tesla의 가장 주력 주제는 자기 지도 학습입니다
Tesla는 8개의 서라운드 카메라가 장착된 750,000대의 자동차를 보유하고 있습니다.
이를 하루에 1시간만 운용해도 매월 약 1억 7천만 시간의 360비디오를 저장 가능합니다
이를 Labeling하는 것은 굉장히 큰 비용과 시간이 발생하며 이 때문에 모델을 Label 없이
학습할 수 있는 자기지도학습이 필요합니다

2.제한된 데이터에서 최대한의 정보를 추출하는 경우
예시: Yann LeCun Cake
비지도학습과 지도학습을 설명하기 위한 일종의 비유입니다.
관심이 있는 대상이 케이크 전체라면 Pure reinforcement learning은 이 중 체리(굉장히 작은부분)이며
Supervised learning은 케이크의 icing(크림; 여전히 상대적으로 작은)부분,
그리고 비지도 학습은 케이크 전체를 의미합니다.
적은 양의 데이터를 넣었을 때 모델은 적절한 성능을 보이지 못할 확률이 높습니다.
비지도학습은 더 많은 input을 제공해줍니다.

얘시: Google, MICLe(Multi-Instance Contrastive Learning)
꼭 데이터가 많다고 성능이 좋다고 할 순 없습니다. 데이터가 많아도 적절하지 못하다면
모델은 잘못된 학습을 할 확률이 높습니다.
그러나 Google은 2020년 의료영상 분야에서 비지도 학습의 효과를 입증했습니다

일반적으로 다른 분양에서는 Label이 상대적으로 쉽게 가능하지만
의료 분야에서는 전문 의료인만 가능하기 때문에 Labeling의 난이도가 높습니다
그렇기때문에 비용에 대한 부담이 더 큽니다
처음부터 학습한 모델(from scratch)보다, SSL을 통해 사전학습을 한 모델의 경우 더 좋은 성능을 보여주었습니다
eXplainable AI(XAI)

딥러닝 모델의 결과를 인간이 이해하기 힘든 부분이 있음(안의 weight가 너무 많다거나,,etc)
XAI : 딥러닝 모델의 결과값에 대한 이유를 인간이 이해할 수 있도록 하는 딥러닝 전용 분석 툴입니다
-> 왜 성능이 좋은지 or 왜 낮은지
예시: multi-label chest x-ray classification

X-ray 분류의 정확도가 높게 나왔음 이를 XAI를 통해 모델을 분석해보니
실제 병변을 근거로 분류하는 것이 아니라 기흉 환자의 경우 안에 삽입된 관( 위의 사진에서 밝게 빛나는 부분)을
기준으로 calssificaition을 진행하는 것을 확인하였습니다