精华内容
下载资源
问答
  • 非root用户在服务器安装CUDA和cudnn到指定目录(只修改自己的环境,对其它用户环境没有影响) 测试系统:ubuntu16.04 需求:系统安装cuda10.0满足不了任务需求,需要安装cuda10.1 1.下载cuda10.1(下update2,...

    非root用户在服务器上安装CUDA和cudnn到指定目录(只修改自己的环境,对其它用户环境没有影响)

    测试系统:ubuntu16.04
    需求:系统安装的cuda10.0满足不了任务需求,需要安装cuda10.1

    1.下载cuda10.1(下update2,其他版本无法自定义目录)寻找适合的版本

    https://developer.nvidia.com/cuda-10.1-download-archive-update2
    

    下载命令

    wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
    

    2.下载cudnn,要对应cuda的版本,手动下载下来上传至服务器

    https://developer.nvidia.com/rdp/cudnn-download
    

    选择 “cuDNN Library for Linux”,下载下来是一个tgz的压缩包。

    3.创建两个目录(我的目录是/home/quaner)

    cd ~
    mkdir cuda-10.1
    mkdir cuda-10.1/mylib
    

    这里目录名不要命名为cuda,最好加上后面的后缀,或者其他名字,只要不是cuda就行,以免后面解压cudnn时直接覆盖

    4.安装CUDA

    sh cuda_10.1.243_418.87.00_linux.run		#名字注意要和安装的包对应上
    

    选择accept 后,更改安装选项(‘X’ 代表选中,只安装CUDA Toolkit)

    选中Options:

    先更改Toolkit Options (/usr这种非用户目录的都要去掉,我这里全去掉了,另外进入 Change Toolkit Install Path设置cuda安装到自己具有写入权限的路径(提前建好),我这里是“/home/yourname/cuda-10.1/”):

    路径要改对了,图片来自其他博客
    做完Done,回到Options菜单, 更改Library install path:

    成功之后会有个提示“summary”

    5.更改环境变量

    vim ~/.profile
    

    在尾部添加(将cuda的各种库目录添加到环境变量):

    export PATH="/home/yourname/cuda-10.1/bin:$PATH"
    export LD_LIBRARY_PATH="/home/yourname/cuda-10.1/lib64:/home/yourname/cuda-10.1/mylib/lib64:$LD_LIBRARY_PATH"
    

    刷新环境变量:

    source ~/.profile
    

    测试CUDA:

    nvcc -V
    

    6.安装CUDNN

    tar -zxvf cudnn.tgz			#这里的文件名要对应上下载的cudnn文件名
    cd cuda 					# 此处进入cudnn解压的目录
    
    cp ./include/cudnn.h ~/cuda-10.1/include		#复制粘贴
    cp ./lib64/libcudnn* ~/cuda-10.1/lib64			#复制粘贴
    
    chmod a+r ~/cuda-10.1/include/cudnn.h ~/cuda-10.1/lib64/libcudnn*
    

    成功~

    展开全文
  • 基本的环境 首先了解自己服务器的操作系统内核版本等信息: 查看自己操作系统的版本信息:cat /etc/issue或者是 ...nvidia-smi如果已经安装了对应的显卡驱动的话可以采用这个命令。 cat /proc/driver/nvidia/ve...

    基本的环境

    1. 首先了解自己服务器的操作系统内核版本等信息:
      1. 查看自己操作系统的版本信息:cat /etc/issue或者是 cat /etc/lsb-release等命令

      2. 查看服务器显卡信息:

        1. lspci | grep -i nvidia查看全部显卡信息。
        2. nvidia-smi如果已经安装了对应的显卡驱动的话可以采用这个命令。
        3. cat /proc/driver/nvidia/version查看安装的显卡的驱动信息。


        显卡驱动的安装需要根据操作系统的版本进行选择。

    多版本的gcc 和g++

    gccg++是很多驱动安装过程中需要使用的编译器,很多时候由于编译器版本的不对应会使得安装出现很多莫民奇妙的错误,根据经验,现在的CUDA 10.1的话,也可以使用的是4.8,因此最好选择4.8-5.4之间的版本比较好,兼容一点。对于多版本的gccg++的安装进行详细的讲解:

    1. 查看自己的gccg++版本:gcc --version以及 g++ --version
    2. 安装新的或者安装多版本的gcc以及g++的流程:
      1. sudo add-apt-repository ppa:ubuntu-toolchain-r/test首先加入一些更新的仓库,以便于更新。
      2. sudo apt-get update以及sudo apt get update对需要的软件包等进行必要的更新。
      3. sudo apt-get install gcc-4.9以及sudo apt-get install g++-4.9用于安装对应版本的gcc以及g++。注意自己需要的版本自己修改。
      4. sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20
        sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20
        这两行用于将刚安装的gccg++类似于注册的操作加入到bin中,用于可选择操作。也就是说通过这个操作不断向系统注册新的gccg++版本。
      5. update-alternatives --config gcc
        update-alternatives --config g++用于对版本进行选择。进入之后根据提示完成选择即可。如果权限不够加 sudo
      6. 一般我们是使用4.8-5.4之间的版本编译器即可。如果还是出现错误的话,首选的操作应该是卸载显卡驱动重装显卡驱动。这个方法的成功率最高。

    驱动安装

      如果需要安装显卡的话,需要先将旧版本的显卡驱动卸载:

      sudo apt-get remove --purge nvidia*

      此外,安装之前,需要先禁用一个东西。nouveau。
      sudo vim /etc/modprobe.d/blacklist.conf
      在文件的最后面加入以下的内容:

    blacklist nouveau
    blacklist lbm-nouveau
    options nouveau modeset=0
    alias nouveau off
    alias lbm-nouveau off
    

      检查操作是否成功:lsmod | grep nouveau没显示即成功。

      显卡驱动的安装比较简单,直接到官网进行对应的驱动的下载。点我下载

      注意在驱动的下载那里,操作系统的选择直接选择LInux-xbit即可,这个是可以搜索得到的,如果选择ubuntu16等搜不到。亲测直接搜索Linux 64-bit安装有效可用!

      将下载好的显卡驱动上传到服务器进行安装。

      sudo ./NVIDIA-Linux-x86_64-430.34.run采用该命令进行驱动的安装。安装完成之后,可以采用以下命令进行检查:

      nvidia-smi

    CUDA安装以及cudnn安装

      CUDA是GPU进行计算的运算平台,根据需要安装对应版本的cuda。
    这里需要注意的是,最好在安装显卡驱动的时候选择对应的 cuda版本,然后在安装cuda的时候的版本保持一致,虽然高版本的驱动可以兼容低版本的cuda

    1. 下载对应版本的cuda。cuda各个版本下载点我哦。由于这个网站的入口比较难找,大家最好保存起来哦。
      这是我自己下载的版本。将下载的版本也上传到服务器上进行安装。

      sudo sh cuda_10.0.130_410.48_linux.run安装方式可以百度一哈。

      安装过程中的选择项:
      1. nvidia accelerated graphics driver ,n 。因为我们已经安装过。
      2. 其他的都选yes。
      3. 软连接的建立。注意还有一个选项是软连接的建立,会在/usr/local/下面建立一个软连接cuda该软连接连接到安装的真正的cuda-10.0的地址。软连接的建立可以用于多个版本的cuda的管理。
        如图所示的,黄色的cuda是一个软连接,红色的是多个安装好的CUDA修改软连接就可以修改cuda的版本。
        这是安装完成之后的内容。安装完成之后,采用

    nvcc -V对安装进行检查。



    如果提示没有找到对应的命令的话,需要进行环境变量的配置。这里我们按照假设建立的cuda的软连接的方式进行配置:

    sudo vim ~/.bashrc加入以下的内容:

    export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
    export PATH=$PATH:/usr/local/cuda/bin
    export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
    

    之后再使用nvidia-smi

    1. 多版本的CUDA管理。其实很简单,就是那个软连接的管理,例如我需要其他版本的cuda,由于我的环境比变量直接指向的是一个软连接,因此我可以删除旧的软连接再建立新的软连接的方式来实现不同版本的cuda的切换。
    sudo rm -rf cuda # 删除旧版本的软连接
    sudo ln -s /usr/local/cuda-9.1 /usr/local/cuda  # 建立新版本的软连接,前面的路径是需要的版本的cuda的安装路径。
    
    1. 安装对应的cudnn。根据cuda版本选择对应的cudnn进行安装。点我进行下载
      进去之后花花绿绿的什么鬼一大堆,如果采用安装的方式的话,需要每个版本的操作系统需要下载3个deb文件,就很烦。因此我们直接下载箭头对应的版本,改文件的后缀是cudnn-10.0-linux-x64-v7.3.0.29.solitairetheme8这种也是也是tgz。将下载来的文件进行解压即可。
    cp  cudnn-10.0-linux-x64-v7.3.0.29.solitairetheme8 cudnn-10.0-linux-x64-v7.3.0.29.tgz # 换后缀
    tar -xvf cudnn-8.0-linux-x64-v5.1.tgz  # 解压
    

    解压之后得到一个 cuda文件夹。采用如下的操作进行cudnn的安装。(这时候的cudnn要直接安装到对应的版本的cuda的真实的安装路径中。这样建立软连接的时候才会读到cudnn文件)

    sudo cp cuda/include/cudnn.h    /usr/local/cuda-xx.x/include # 填写对应的版本的cuda路径
    sudo cp cuda/lib64/libcudnn*    /usr/local/cuda-xx.x/lib64   # 填写对应的版本的cuda路径
    sudo chmod a+r /usr/local/cuda-xx.xx/include/cudnn.h   /usr/local/cuda-xx.xx/lib64/libcudnn*
    

    如果喜欢采用deb的安装方式的参见


    以上流程如果走下来还是出错的话,建议重新卸载显卡驱动再来一次。




    Anaconda了解和安装

    采用Anaconda进行python环境的管理是一个很高效的解决方案。从仓库下载对应版本的软件进行安装。点我下载

    bash Anaconda3-5.0.1-Linux-x86_64.sh安装。安装过程需要同意将安装路径加入到环境变量的配置文件中。
    source ~.bashrc使其生效。

    1. 建立自己新的环境 conda create-n your_name python=your_version
    2. 激活新的环境 source activate your_name

    Pytorch安装

    到pytorch官网下载对应版本的pytorch 即可。官网

    根据生产的命令进行安装。安装完成之后测试:

    python  # 进入python 环境
    import torch  # 导入安装的pytorch包
    torch.cuda.is_available()  # 检查cuda是否可以使用
    

    如果torch.cuda.is_available()如果输出是false,那就表示前面的驱动或者cuda的安装有问题,最可能的就是驱动。直接卸载重新安装显卡驱动即可解决问题。

    展开全文
  • conda 安装CUDA和cudnn,没有亲测过 https://blog.csdn.net/bjay/article/details/113829133

    conda 安装CUDA和cudnn,没有亲测过
    https://blog.csdn.net/bjay/article/details/113829133

    展开全文
  • 安装CUDA和cuDNN到指定目录 环境 ubuntu 16.04 anaconda 4.7.10 需求 先前已经参考这个博客安装cuda10.1,但现在需要在服务器安装cuda10.0并实现多版本cuda管理,而且cuda10.0没有所谓的update版本,而笔者又...

    安装CUDA和cuDNN到指定目录

    环境

    ubuntu 16.04

    anaconda 4.7.10

    需求

    先前已经参考这个博客安装了cuda10.1,但现在需要在服务器上安装cuda10.0并实现多版本cuda管理,而且cuda10.0没有所谓的update版本,而笔者又没有管理员权限,因此需要另找方法。

    步骤

    1. 先到官网下载对应版本的cuda和cudnn,我下载的是cuda_10.0.130_410.48_linux.run和cudnn-10.0-linux-x64-v7.6.5.32.tgz(科学上网下载速度可能会快一点)

    2. 运行以下命令查看帮助

      sh cuda_10.0.130_410.48_linux.run --help

      得到命令提示,其中有几个option比较有用

      Options:
        --silent
          Performs an installation with no further user-input and minimal
          command-line output based on the options provided below. Silent
          installations are useful for scripting the installation of CUDA.
          Using this option implies acceptance of the EULA. The following flags
          can be used to customize the actions taken during installation. At
          least one of --driver, --uninstall, --toolkit, and --samples must
          be passed if running with non-root permissions.
          
        --toolkit
          Install the CUDA Toolkit.
      
        --toolkitpath=<path>
          Install the CUDA Toolkit to the <path> directory. If this flag is not
          provided, the default path of /usr/local/cuda-10.0 is used.

      由于此时安装我只需要安装cuda toolkit,因此可以使用--toolkit并用--toolkitpath来指定安装位置,同时需要使用--silent才能够正常安装。

      运行以下命令安装(<path>替换成安装位置的绝对路径)

      sh cuda_10.0.130_410.48_linux.run --toolkitpath=<path> --toolkit -silent
    3. 安装cudnn,按照这个博客第6步解压下载的压缩包,复制粘贴到cuda对应的目录,并赋予权限即可。

    4. 配置环境变量(参考博客

      由于我只需要在某一个项目内使用这个版本的cuda,因此我可以在虚拟环境内配置环境变量,在base环境中使用默认的cuda。

      首先创建虚拟环境(cuda_test为虚拟环境名)

      conda create -n cuda_test python=3.6

      在anaconda的目录新建启动该虚拟环境时需要运行的脚本

      mkdir -p envs/cuda_test/etc/conda/activate.d
      vim envs/cuda_test/etc/conda/activate.d/activate.sh
      chmod +x envs/cuda_test/etc/conda/activate.d/activate.sh

      在打开activate.sh脚本时输入以下内容,使得该虚拟环境启动时,自动切换为cuda10.0

      ORIGINAL_CUDA_HOME=$CUDA_HOME
      ORIGINAL_LD_LIBRARY_PATH=$LD_LIBRARY_PATH
      ORIGINAL_PATH=$PATH
      export CUDA_HOME=<cuda安装位置的绝对路径>
      export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH
      export PATH=$CUDA_HOME/bin:$PATH

      在anaconda的目录新建退出该虚拟环境时需要运行的脚本

      mkdir -p envs/cuda_test/etc/conda/deactivate.d
      vim envs/cuda_test/etc/conda/deactivate.d/deactivate.sh
      chmod +x envs/cuda_test/etc/conda/deactivate.d/deactivate.sh

      在打开deactivate.sh脚本时输入以下内容

      export CUDA_HOME=$ORIGINAL_CUDA_HOME
      export LD_LIBRARY_PATH=$ORIGINAL_LD_LIBRARY_PATH
      export PATH=$ORIGINAL_PATH
      unset ORIGINAL_CUDA_HOME
      unset ORIGINAL_LD_LIBRARY_PATH
      unset ORIGINAL_PATH
    5. 测试cuda是否成功安装

      在base环境下运行

      nvcc -V
      

      得到原来cuda的版本信息

      nvcc: NVIDIA (R) Cuda compiler driver
      Copyright (c) 2005-2019 NVIDIA Corporation
      Built on Sun_Jul_28_19:07:16_PDT_2019
      Cuda compilation tools, release 10.1, V10.1.243
      

      进入虚拟环境之后

      conda activate cuda_test
      nvcc -V

      得到新安装的cuda版本信息

      nvcc: NVIDIA (R) Cuda compiler driver
      Copyright (c) 2005-2018 NVIDIA Corporation
      Built on Sat_Aug_25_21:08:01_CDT_2018
      Cuda compilation tools, release 10.0, V10.0.130
      

      至此完成安装

    展开全文
  • ubuntu非root用户安装cuda和cudnn

    千次阅读 2019-11-05 10:02:44
    考虑到多人共用一个服务器做深度学习实验,有时候所需的cuda版本可能不一样,所以有必要在非root用户下安装自己的cuda和cudnn. 步骤 1.下载 cuda下载 https://developer.nvidia.com/cuda-downloads. 我下载的是cuda...
  • 非root用户安装CUDA和CuDNN

    千次阅读 2018-11-13 10:42:07
    这里写自定义目录标题Linux驱动程序安装CUDACuDNN Linux驱动程序安装 最近一直在机器上跑pytorch,无奈公司的机器没有root权限,一直有版本不匹配的情况,所以自己又重新安装了一下CUDACuDNN的版本,这次以CUDA8.0...
  • 在win10上安装CUDA和cuDNN总是有很多人安装失败。 软件明明安装成功了为什么还是无法运行呢? 原因是你安装的姿势可能出了点问题(你安装的版本不对) 正确的安装姿势: 1、查看本机的CUDA驱动适配版本 桌面...
  • Ubuntu下安装cudacudnn和pytorch服务器配置cuda和cudnn安装安装一台电脑时候,遇到`'torch.cuda.is_available()`',输出是False的情况。 服务器配置 公司新配了几台2080TI主机打算做分布式训练,我事先以安装好...
  • 安装CUDA和cuDNN

    2020-10-10 11:34:00
    (我的)目标:想自己从源码编译一下Pytorch,发现需要安装CUDA和cuDNN,于是有流程如下: 1. 检查是否安装了显卡驱动 你的服务器上有若干张显卡,你可能已经安装了显卡驱动(通过apt-get install)也可能没有。如果你...
  • 文章目录1.创建服务器2.配置CUDAcuDNN3....然后选择所需的CUDA以及cuDNN版本号,这里要注意一定要安装与自己想安装的深度学习库(TensorFlow、PyTorch、PaddlePaddle、Keras、caffe等)所对应的CUDAcuDNN
  • 既然都是非root用户安装了,一般也是用的服务器,所以驱动一般都是安装好的,如果是其他情况需要安装,可以参考ubuntu安装CUDAcuDNN 2. 安装CUDA 可以参考知乎-非root用户安装cudacudnn安装cuda部分,主要就是...
  • 这段时间在做YOLO v4的目标检测,由于对CUDA和CUDNN有要求,只能重新搭建环境了。 一、CUDA安装 如果已经是CUDA 10.0的可以忽略此步骤 1、安装多版本的CUDA,可自由切换 到CUDA官网版本库中下载cuda 10.0版本...
  • 首先在终端输入:nvidia-smi,如出现下图说明显卡驱动已安装好,可直接跳到步骤二 ...将下载好的驱动文件使用sftp上传到服务器/home文件夹下: 3.安装相关依赖库: sudo apt-get install libprotobuf-dev
  • 服务器管理员提示use spack to load cuda,那咱就照做咯 spack install cuda 发现已经安装(主要是获取cuda root) spack install cudnn 等待安装(装好了才来写的博客所以没截图), 若要安装特...
  • 1、查看cuda版本 cat /usr/local/cuda/version....cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 操作示例如下: (py366) nfz@Qlab:~$ cat /usr/local/cuda/version.txt CUDA Version 8.0.61 (...
  • 环境为ubuntu16.04,显卡驱动版本384.130.由于CUDACUDNN、显卡驱动、tensorflow-gpu版本都要相互对应才能正常...一、下载cuda8和cudnn6 1.下载cuda8.0 由于驱动版本为384.130,这里选择CUDA8.0GA2. 以下为对照表 ...
  • 1.准备工作(下载CUDA10.0和cudnn安装包) 查看tensorflow和CUDAcudnn的版本的对应关系,从而选择合适的版本进行下载 下载CUDA10.0安装包,点击官网进行下载,根据服务器的具体情况选择对应的版本,如下图所示...
  • Ubuntu18.04安装CudaCudnn、Tensorflow-gpu

    千次阅读 2018-09-24 22:47:43
    Ubuntu18.04安装CudaCudnn、Tensorflow-gpu Let’s go 首先安装配置如下: GTX1050Ti + Cuda9.0 + Cudnn7.0.5 + Tensorflow-gpu1.8.0 安装前也许你需要看看Tensorflow、CudaCudnn版本对应 链接1 链接2 First 1....

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 4,674
精华内容 1,869
关键字:

服务器安装cuda和cudnn