ubuntu24.04卸载apt安装的驱动nccl和cuda库

由于拿到机器是apt安装的nvidia驱动、cuda和nccl,我需要换个版本并改成本地安装的方式,以下是卸载过程记录方便以后使用。

sudo systemctl stop nvidia-fabricmanager
sudo systemctl disable nvidia-fabricmanager

终止所有使用 GPU 的进程,避免文件冲突

sudo fuser -v /dev/nvidia* | awk '{print $2}' | xargs -I {} kill -9 {}

解除更新锁定

sudo apt-mark unhold 'nvidia-*' 'libnvidia-*'

彻底删除nvidia相关软件和库

sudo apt purge --allow-change-held-packages 'nvidia-*' 'libnvidia-*'

移除所有 CUDA 相关包及其配置文件

sudo apt purge --allow-change-held-packages '*cuda*' '*cublas*' '*cufft*' '*cufile*' '*curand*' '*cusolver*' '*cusparse*' '*npp*' '*nvjpeg*' 'nsight*' '*nvvm*'

移除所有 NCCL 相关包

sudo apt purge libnccl2 libnccl-dev

清理自动安装的、不再需要的依赖包

sudo apt autoremove --purge

清理本地软件包缓存

sudo apt autoclean

删除可能残留的 CUDA 目录和文件

sudo rm -rf /usr/local/cuda*
sudo rm -rf /usr/local/nvidia*
sudo rm -f /etc/ld.so.conf.d/cuda.conf
sudo rm -rf ~/.nv/
sudo rm -rf /usr/lib/nvidia*
sudo rm -rf /usr/lib/x86_64-linux-gnu/libnvidia*
sudo rm -rf /usr/share/doc/nvidia-*
sudo rm -rf /var/lib/dkms/nvidia*
sudo rm -f /etc/ld.so.conf.d/nvidia-*.conf
sudo rm -f /etc/modprobe.d/nvidia-*.conf
sudo rm -f /etc/apt/sources.list.d/nvidia-*.list

删除 fabricmanager 可能遗留的目录

sudo rm -rf /opt/nvidia/fabricmanager
sudo rm -f /usr/bin/nvidia-fabricmanager-*

最后更新动态链接库缓存

sudo ldconfig

更新 initramfs 并重启

sudo update-initramfs -u
sudo reboot

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.sulao.cn/post/1167

评论列表

0%