1. 문제 상황
터미널에서 학습 코드를 실행시키자 마다 아래와 같은 에러가 발생했다.
곧바로, nvidia-mi 및 watch -d -n 0.5 nvidia-smi를 찍어보니 GPU를 사용하고 있지 않음에도 Memory-Usage 부분에서 메모리가 정리되지 않고 있었다.

2. 문제 원인
실험을 하면서 input, output 찍어본다고 강제종료를 했던 탓,,! (Ctrl + c)
학습 프로세스를 강제 종료할 시에는 간혹 프로세스가 완전히 종료되지 않고 GPU 메모리에 찌꺼기가 남아 있는 경우가 발생한다.
이렇게 되면 다시 학습을 실행시킬 경우 메모리가 가득차서 학습이 되지 않는다.

3. 문제 해결
1) 아래와 같은 명령어를 입력하여 딥러닝 학습을 실행시킨 파이썬 파일의 ID를 찾는다.
<bash />ps aux | grep python
2) 찾은 아이디가 '1342' 이라면 아래와 같은 명령어를 사용하여 kill
<bash />
sudo kill -9 '1342'
3) GPU 메모리가 잘 정리되었는지 확인한다.
<bash />nvidia-smi

'Programming > TIL' 카테고리의 다른 글
백준 문제 VS Code에서 실행하기 (0) | 2025.02.11 |
---|---|
한줄 TIL (0) | 2025.02.08 |
[ModuleNotFoundError : No module named [패키지명]] 패키지가 없다고 뜰때 ? (0) | 2023.09.26 |
[Host key verification failed] 서버 우회 접속이 안될 때 (0) | 2023.08.13 |
ModuleNotFoundError : No module named BeautifulSoup4 (0) | 2022.12.29 |