카테고리 없음

[딥러닝]cuda out of memory 해결

Im_light.J 2023. 1. 20. 06:00
728x90

cuda out of memory가 떠서 cuda도 비워주고 gc.collcet도 해봤는데 해결이 안될때가 간혹 존재합니다 

프로세스도 조회를 해보면 진행 중인게 따로 안보이네요 

저 같은 경우엔 서버 연결 문제로 중간에 접속이 끊어지는 경우 이런 현상이 발생했습니다 

이런 경우 해결하는 법을 알아보겠습니다 

 

아래의 명령어를 터미널에 입력해주시면 됩니다 

 

for i in $(sudo lsof /dev/nvidia1 | grep python | awk '{print $2}' | sort -u); do kill -9 $i; done

목표하는 GPU의 프로세스를 강제로 죽이는 코드입니다. /dev/nvidia{숫자}에 GPU의 번호를 적어주시면 됩니다 

저는 0과 1번의 프로세서를 종료시켜 줬습니다

 

 

728x90