centos7更新nvidia显卡驱动

本文档介绍了如何处理Docker启动时遇到的NVIDIA驱动与CUDA版本不匹配的问题。首先,通过nvidia-smi命令检查驱动版本,然后卸载旧版驱动,屏蔽nouveau,重建initramfs image,设置系统运行级别为文本模式,最后安装兼容的NVIDIA驱动。通过这些步骤,可以解决显卡驱动与CUDA的兼容性问题,确保Docker容器正常启动。

问题

docker: Error response from daemon: OCI runtime create failed: container_linux.go:344: starting
container process caused "process_linux.go:424: container init caused \"process_linux.go:407: running
prestart hook 1 caused \\\"error running hook: exit status 1, stdout: , stderr: exec command: 
[/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig.real --device=all --
compute --utility --require=cuda>=10.0 brand=tesla,driver>=384,driver<385 --pid=7142 
/var/lib/docker/overlay2/c2f4ac7d7d905051e77682447a97f563cbdf7ccf2fe43afccdb521350adab0f4/mer
ged]\\\\nnvidia-container-cli: requirement error: unsatisfied condition: brand = tesla\\\\n\\\"\"": unknown.
复制代码

原因:

显卡驱动版本和cuda10不兼容(版本信息)
查看驱动版本命令:nvidia-smi

 

一、环境

内核:3.10.0-514.26.1.el7.x86_64

gcc:4.8.5

二、卸载旧版驱动

使用 chmod a+x 给下载的.run文件添加执行权限,然后使用 --uninstall参数进行旧版驱动卸载

chmod a+x NVIDIA-Linux-x86_64-440.33.01.run (对应老驱动版本)
./NVIDIA-Linux-x86_64-440.33.01.run --uninstall

or 

使用如下命令卸载:

sudo /usr/bin/nvidia-uninstall

三、安装显卡驱动

1、检查是否屏蔽掉了默认的nouveau

lsmod | grep nouveau

有输出内容则没有屏蔽

2、屏蔽掉了默认的nouveau

vim /lib/modprobe.d/dist-blacklist.conf
将nvidiafb注释掉:
#blacklist nvidiafb 

然后添加以下语句:
blacklist nouveau
options nouveau modeset=0

3、重建initramfs image步骤

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

dracut /boot/initramfs-$(uname -r).img $(uname -r)

4、修改运行级别为文本模式

systemctl set-default multi-user.target

5、重启系统

reboot

6、验证nouveau是否已禁用(无输出则代表已禁用)

lsmod | grep nouveau

7、开始安装显卡驱动

chmod a+x NVIDIA-Linux-x86_64-440.33.01.run
./NVIDIA-Linux-x86_64-440.33.01.run 

没有报错的话会很快完成!!!!

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值