释放僵死程序占用的 GPU Memory

某个 PyTorch 写的程序如果强行退出,会导致 GPU Memory 不释放。下面我们来解决这个问题。

首先,使用 fuser -v /dev/nvidia* 查看是哪些进程跑在了 GPU 上。

我们可能会得到这样的东西:

好多……

然后,使用 xargs kill -9 进程 PID 将它们一个一个结束掉。这样世界就清静了。

但是一个一个结束也是好烦人的…… 所以,继续脚本代劳:

一个命令运行下去,世界瞬间清静。

或者再懒一步,设置个 alias:

将上面一行代码加入到.zshrc 中,重新打开 zsh 即可。

参考资料

发表评论

电子邮件地址不会被公开。 必填项已用*标注