【软件安装】Ubuntu22.04下深度学习环境安装指南

假设,现在你的系统是刚刚安装的Ubuntu22.04,建议使用EFI启动,BIOS启动下编译第三方内核模块会报签名错误,你在安装深度学习环境的时候,可能遇到一些我遇到的坑,或者你可以直接按照我的安装步骤安装。

首先,Tensorflow在2.10.1(最后一个支持的版本)之后就不支持Windows原生的基于CUDA环境的GPU加速了,Windows环境的同学,可以使用Tensorflow-gpu==2.10.1;对于Linux环境的同学,Tensorflow在2.11.0(最后一个Tensotflow-gpu版本)之后就不区分Tensotflow和Tensotflow-gpu了(本文发表于2023年4月19日,如之后Tensorflow重新支持Windows原生的基于CUDA环境的GPU加速,请原谅我未能及时修改,请联系我)。

对于已经安装了最新的显卡驱动,仅支持CUDA12.1的用户来说,请不要慌张,CUDA12.1无论是Windows还是Linux环境中都完全可以使用Tensorflow和Pytorch两个主流深度学习框架的。

显卡驱动

首先,你需要安装显卡驱动,显卡驱动从这里下载:https://www.nvidia.cn/Download/index.aspx?lang=cn

当然你必须选择合适的驱动版本,这个需要你根据你使用的CUDA版本来决定,尽量先单独安装驱动,以免安装CUDA时安装驱动报错。

安装依赖

在安装显卡驱动的时候可能要编译内核的一些驱动文件,所以说我们需要安装一些依赖。

sudo apt-get install g++
sudo apt-get install gcc
sudo apt-get install make
sudo apt-get install build-essential 
sudo apt-get install cmake
sudo apt-get install lightdm

当然,在此之前,我建议你更换清华源来加快下载。并且,更换清华源可以减少很多烦恼,有些软件在系统默认的源中并没有。例如Git的依赖liberror-perl,你需要更换为清华源再使用apt-get安装Git。

更换清华源的教程:https://mirrors.tuna.tsinghua.edu.cn/help/ubuntu/

更换完毕后请不要忘了更新apt-get。

sudo apt-get update

禁用nouveau

然后,你需要禁用一个名为nouveau的服务,否则,将会在安装Nvidia驱动时给你抛出一个ERROR。

在此之前,我建议你安装一个文本编辑器,Vim或者Gedit。当然,如果你喜欢使用vi也是可以的。

其中一种办法是在blacklist.conf文件末追加相关内容。

sudo gedit /etc/modprobe.d/blacklist.conf

在其文件末尾追加以下内容:

blacklist nouveau
options nouveau modeset=0

或者你也可以新建一个blacklist-nouveau.conf文件,专门用于禁用nouveau服务。当然,这两种方法的效果是一样的。

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

将上述两行代码,复制于其中。

当然,这些都需要重启生效,请对你的终端输入以下代码。

sudo update-initramfs -u
sudo reboot

重启后,你需要切换为命令行模式进行安装,请按先后顺序一起按下键盘上的Ctrl+Alt+F1三个按键。

你随时可以在安装驱动成功后按先后顺序一起按下Ctrl+Alt+F7恢复图形界面。

cd $Path of Driver File$请将此处替换为你下载驱动的目录
sudo chmod +x NVIDIA-Linux-x86_64-525.105.17.run
sudo ./NVIDIA-Linux-x86_64-525.105.17.run

如果提示以下内容

Error: you appear to running an x server;please exit x before installing.

请使用-no-x-check参数,命令如下:

sudo ./NVIDIA-Linux-x86_64-525.105.17.run -no-x-check

安装过程相对简单,且过程中可能遇到的问题,在各大搜索引擎中都很容易检索得到,我就不在此赘述了。安装完成后,请在终端中输入以下命令,验证是否安装成功。

nvidia-smi

输出上图所示内容则安装成功。

CUDA Toolkit

接下来,你需要安装CUDA Toolkit,CUDA从这里下载:https://developer.nvidia.com/cuda-toolkit-archive

同样你必须选择合适的CUDA版本,要与你下载的驱动相匹配,这里我推荐使用runfile安装,Linux的runfile是自带驱动的,但是我不建议使用其自带的驱动安装,建议预先安装驱动,并取消安装位于第一行的驱动,因为我经常遇到报错的现象。

如果说你使用的环境是Pytorch,其实你只需要安装Nvida的显卡驱动和CUDA Toolkit,经过我的测试,只安装这些也可以使用Pytorch,当然为了你以后学习Tensorflow也好,为了免去一些未知的BUG也好,我还是建议你安装CUDNN和TensotRT。

上一篇