ubuntu14.04下NVIDIA Tesla K80显卡驱动安装教程

2023-08-19 1447阅读

目前主流的深度学习工具软件,无论是Caffe、Theano还是Tensorflow,都离不开GPU显卡加速技术的支持。目前主流的基于GPU加速的深度学习环境是linux下的cuda。作为NVIDIA目前针对科学计算加速的高性能产品,Tesla K80无疑成为了一个理想的目标。但由于linux的开源特性,nouveau成为了Ubuntu等一系列linux操作系统中默认的NVIDIA显卡驱动。然而,作为NVIDIA这样的高冷公司,市场式的产品并不被认可。所以为了保证自己显卡的性能,NVIDIA显卡自带了自己的驱动,但是这个root驱动和草根版驱动之间存在着不可调和的冲突。因此,想要使用Ubuntu操作系统来驱动K80,还是需要花费一些周折,但问题的核心是解决两类驱动程序之间的对立。

不跟被“核”覆盖的显卡打交道,怎么能搞深度学习呢?

除了数据量的大量增加、算法的不断完善、计算能力的逐步提升之外,人工智能的崛起还离不开软件基础设施的逐步完善。 目前主流的深度学习工具软件,无论是Caffe、Theano还是Tensorflow,都离不开GPU显卡加速技术的支持。 目前主流的基于GPU加速的深度学习环境是linux下的cuda。 作为NVIDIA目前针对科学计算加速的高性能产品,Tesla K80无疑成为了一个理想的目标。 但由于linux的开源特性,nouveau成为了Ubuntu等一系列linux操作系统中默认的NVIDIA显卡驱动。 然而,作为NVIDIA这样的高冷公司,市场式的产品并不被认可。 所以为了保证自己显卡的性能,NVIDIA显卡自带了自己的驱动,但是这个root驱动和草根版驱动之间存在着不可调和的冲突。 因此,想要使用Ubuntu操作系统来驱动K80,还是需要花费一些周折,但问题的核心是解决两类驱动程序之间的对立。 方法很简单,去掉一个即可。 下面介绍一下具体的操作步骤。

1、安装ubuntu14.04(具体操作方法我就不多说了,但是需要强调的是,DELL的个人电脑在安装Ubuntu时可能会经常出现图形界面无法使用的情况,估计是驱动不兼容问题,如果你没有独立显卡,就不用麻烦了。好在这次搭建的环境是PowerEdgeC4230 DELL服务器,所以安装个gnome问题不大)

2、既然是驱动冲突,自然要杀掉与显卡结合不那么紧密的草根板驱动nouveau。 我们需要做的第一件事就是将其添加到黑名单中:

2.1 在/etc/modprobe.d/文件夹下创建blacklist-nouveau.conf文件

2.2 使用vi方便新建的文件在文件中写入:

ubuntu14.04下NVIDIA Tesla K80显卡驱动安装教程

黑名单新作

选项 nouveau 模式集=0

保存文件(最好使用vi编辑器,尽量不要使用nano等不太主流的编辑器,之前安装失败可能是因为使用了nano编辑)

2.3 输入 update initramfs -u 命令获取更新后的黑名单

2.4 输入reboot命令重启系统,有力保证黑名单生效。

2.5 输入lsmod | grep nouveau 来检查 vouveau 是否真的被杀死。 如果没有出现,那么恭喜你,已经成功删除了草民版驱动。

ubuntu14.04下NVIDIA Tesla K80显卡驱动安装教程

3.下载官方NVIDIA K80显卡驱动程序。 我们这里使用361版本。 将驱动程序文件移动到 /root/ 文件夹。

4、如果文件是压缩文件,则输入解压命令进行解压,得到.run文件

5、下一步是关键一步,这也是困扰我们一天一夜的问题。 键入以下命令:

./XXX-NVIDIA.run --no-opengl-files (重要的事情说三遍,-和字母之间不能有空格,-和字母之间不能有空格,‘-’和不带空格的字母)

6.出现蓝色背景界面,如果出现(X服务器正在运行,注意用户态输入sudo service lightdm stop关闭桌面管理器),则接受协议,然后分发提供的预安装脚本失败出现提示,忽略它,然后继续安装,一路OK然后重新启动系统,最后得到一个完整的gnome桌面系统。

7、检查是否安装成功。 在命令行界面输入nvidia-smi,检查是否安装成功。 如果成功的话会出现下图所示的情况。

相关文章:

VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]