跳到主要内容

多用户、多版本 CUDA 配置手册

说明

服务器用户可直接跳转至多版本 CUDA 的配置

多版本 CUDA 以及 cuDNN 的安装

安装 CUDA

  1. 根据 NVIDIA 驱动程序版本以及期望的 CUDA 版本,从 NVIDIA 官网下载对应版本的 CUDA runfile (local) 安装包。

    wget -c https://developer.download.nvidia.com/compute/cuda/12.4.1/local_installers/cuda_12.4.1_550.54.15_linux.run
  2. 使用 sudo 权限执行安装脚本。

    sudo ./cuda_12.4.1_550.54.15_linux.run
  3. 在安装程序的 Options 选项中分别进入 Toolkit Options 以及 Library Install Path,将 CUDA 安装路径以及库文件路径设置为目标路径,后续即可正常安装。

    注意,为了方便其他平行用户的使用,该路径对于平行用户的权限至少为可读以及可执行,同时不赋予写权限。A100 服务器上 CUDA 的安装路径为 /home/share/cuda/{cuda-version}

  4. 用户向 ~/.bashrc 文件中添加环境变量。

    export PATH="/home/share/cuda/{cuda-version}/bin:$PATH"
    export LD_LIBRARY_PATH="/home/share/cuda/{cuda-version}/lib64:$LD_LIBRARY_PATH"
    export CUDA_HOME="/home/share/cuda/{cuda-version}"
  5. 更新配置文件。

    source ~/.bashrc

安装 cuDNN

说明

从 cuDNN v9.0.0 版本开始,cuDNN 安装包已经全面更新为 deb 安装的方式,这里仍采取传统的通过 cp 命令复制文件的方式进行安装。

  1. 进入 cuDNN archive 页面,根据 CUDA 版本下载对应版本的 cuDNN 安装包。

    服务器为 x86_64 架构的 Ubuntu 22.04,下载 Local Installer for Linux x86_64 (Tar)

  2. 使用 tar 命令解压安装包 cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar

    tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar
  3. 将 cuDNN 库文件复制到 CUDA 安装路径下。

    sudo cp -P /path/to/cudnn/include/* /home/share/cuda/{cuda-version}/include
    sudo cp -P /path/to/cudnn/lib/* /home/share/cuda/{cuda-version}/lib64
    sudo chmod a+r /home/share/cuda/{cuda-version}/include/* /home/share/cuda/{cuda-version}/lib64/*

多版本 CUDA 的配置

  1. A100 服务器共享 CUDA 安装路径为 /home/share/cuda/{cuda-version}

  2. 用户向 ~/.bashrc 文件中添加环境变量。

    export PATH="/home/share/cuda/{cuda-version}/bin:$PATH"
    export LD_LIBRARY_PATH="/home/share/cuda/{cuda-version}/lib64:$LD_LIBRARY_PATH"
    export CUDA_HOME="/home/share/cuda/{cuda-version}"
  3. 更新配置文件。

    source ~/.bashrc
  4. 在后续更换 CUDA 版本时,重复上述步骤,只需更改 CUDA 版本号 {cuda-version} 即可。