Notice
Recent Posts
Recent Comments
Link
250x250
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Archives
Today
Total
관리 메뉴

바닥부터 시작하는 개발 공부

[Computer Vision]Cutmix Augmentation 본문

딥러닝/Computer vision

[Computer Vision]Cutmix Augmentation

Im_light.J 2023. 1. 27. 00:42
728x90

Cutmix는 네이버 클로바에서 발표한 논문 " CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features"에서 제안된 이미지 데이터 증강입니다. 이름에서 알 수 있듯이 직관적으로 이미지를 자르고 붙여서 섞는 기법입니다.

기존에는 ResNet-50 칼럼에서와 같이 이미지를 넣어서 모델을 학습시켰습니다. 그런데 문제는 딥러닝 모델들은 데이터의

작은 perturbation으로도 성능에 굉장히 큰 악영향을 줍니다. 

 

다음 실험에서는 각각 Mixup/ Cutout/ Cutmix 기법을 통해서 훈련시킨 모델이 얼마나 Robust해지는지 대해서 실험을 했습니다. 여기서 상대적으로 Cutmix로 훈련시킨 모델이 가장 강인한 것을 확인 할 수 있었습니다. 

 

딥러닝 알고리즘은 분류문제에서 softmax를 활용하는데 이에 따라서 모델이 결과에 대해 over confidence(예측 확률이 거의 1에 근접하게 되는)한 경향이 있습니다.  이를 체크하기 위한 방법으로 Out of Distribution이 존재합니다. 물론 모델이  In-distribution한 데이터를 정확하게 예측하는 것은 큰 문제가 되지 않습니다. 그런데 , 기존 데이터 셋에는 없던 out of distribution 데이터를 test단계에서 넣어주게 되면 이상적으로는 각 class를 1/n으로 예측해주는 것인데 대부분의 경우 모델은 과한 자신감으로(over-confidence) 하나의 class를 높게 예측하게 됩니다. 

 

 

위 결과는 Pyramid net을 CIFAR데이터 셋으로 학습시킨 결과입니다. Mixup이나 다른 기법들은 over confidence를 증가시켜서 성능이 안좋아지는 반면 Cutmix의 경우 다양한 데이터에 대해 성능이 가장 잘 나온것을 확인 할 수 있었습니다 

 

 

 

 

728x90
Comments