精华内容
下载资源
问答
  • 转载链接:https://blog.csdn.net/qq_27825451/article/details/89082978 写很详细,很好。
    展开全文
  • Status: CUDA driver version is insufficient for CUDA runtime version,描述了显卡驱动与CUDA版本不匹配的问题。 目的:解决版本不匹配的问题。 参考:https://blog.csdn.net/weixin_36474809/a...

    问题:运行程序时报错 InternalError: cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA runtime version,描述了显卡驱动与CUDA版本不匹配的问题。

    目的:解决版本不匹配的问题。

    参考:https://blog.csdn.net/weixin_36474809/article/details/87804903

    目录

    一、当前版本查看

    1.1 查看CUDA驱动版本

    1.2 查看base environment中CUDA运行版本

    1.3 查看当前虚拟环境中CUDA版本

    二、安装对应

    2.1 安装

    2.2 检验


    name: GeForce GTX 1080 major: 6 minor: 1 memoryClockRate(GHz): 1.835
    pciBusID: 0000:83:00.0
    totalMemory: 7.92GiB freeMemory: 1.96GiB
    2019-02-20 20:17:15.278289: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1511] Adding visible gpu devices: 0, 1, 2, 3
    Traceback (most recent call last):
      File "config.py", line 214, in <module>
        args.func(args)
      File "config.py", line 147, in train
        dnnlib.submission.submit.submit_run(submit_config, **train_config)
      File "/home/xxr2019/NVlabs_noise2noise/dnnlib/submission/submit.py", line 296, in submit_run
        run_wrapper(submit_config)
      File "/home/xxr2019/NVlabs_noise2noise/dnnlib/submission/submit.py", line 249, in run_wrapper
        util.call_func_by_name(func_name=submit_config.run_func_name, submit_config=submit_config, **submit_config.run_func_kwargs)
      File "/home/xxr2019/NVlabs_noise2noise/dnnlib/util.py", line 232, in call_func_by_name
        return func_obj(*args, **kwargs)
      File "/home/xxr2019/NVlabs_noise2noise/train.py", line 76, in train
        tfutil.init_tf(config.tf_config)
      File "/home/xxr2019/NVlabs_noise2noise/dnnlib/tflib/tfutil.py", line 77, in init_tf
        create_session(config_dict, force_as_default=True)
      File "/home/xxr2019/NVlabs_noise2noise/dnnlib/tflib/tfutil.py", line 100, in create_session
        session = tf.Session(config=config)
      File "/home/jcx/.conda/envs/n2n/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 1551, in __init__
        super(Session, self).__init__(target, graph, config=config)
      File "/home/jcx/.conda/envs/n2n/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 676, in __init__
        self._session = tf_session.TF_NewSessionRef(self._graph._c_graph, opts)
    tensorflow.python.framework.errors_impl.InternalError: cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA runtime version

    一、当前版本查看

    1.1 查看CUDA驱动版本

    驱动版本即为cuda driver version

    输入nvidia-smi,看到我们服务器上的为:

    NVIDIA-SMI 375.26                 Driver Version: 375.26

    输入cat /proc/driver/nvidia/version

    NVRM version: NVIDIA UNIX x86_64 Kernel Module  375.26  Thu Dec  8 18:36:43 PST 2016
    GCC version:  gcc version 4.8.4 (Ubuntu 4.8.4-2ubuntu1~14.04.3)

    1.2 查看base environment中CUDA运行版本

    运行版本即为cuda runtime version,是在python中安装的cudatoolkit和cudnn程序包的版本

    (n2n) jcx@smart-dsp:~/Desktop/xxr2019/NVlabs_noise2noise$ cat /usr/local/cuda/version.txt
    CUDA Version 8.0.61
    (n2n) jcx@smart-dsp:~/Desktop/xxr2019/NVlabs_noise2noise$ cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
    #define CUDNN_MAJOR      6
    #define CUDNN_MINOR      0
    #define CUDNN_PATCHLEVEL 21
    --
    #define CUDNN_VERSION    (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)
    
    #include "driver_types.h"

     从该图来看,基础环境之中对应关系是没有问题的。

    1.3 查看当前虚拟环境中CUDA版本

    输入pip list即可看到相应的CUDA,但是在此指令之中,没有看到相应的CUDA版本,可能当前版本中CUDA未安装。

    或者输入conda list,看到我们的版本为:我们版本为当前最新版本CUDA,因此需要更新驱动到最新版本。

    cudatoolkit               9.2                           0
    cudnn                     7.3.1                 cuda9.2_0

    二、安装对应

    2.1 安装

    我们看出是CUDA版本过于新,驱动版本不够新,因此我们安装旧版本的CUDA运行版本,

        安装cuda:conda install cudatoolkit=8.0 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/linux-64/

    Downloading and Extracting Packages
    cudatoolkit-8.0      | 322.4 MB  | ####################################################################### | 100%
    Preparing transaction: done
    Verifying transaction: done
    Executing transaction: done

        安装cudnn:conda install cudnn=7.0.5 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/linux-64/

    Preparing transaction: done
    Verifying transaction: done
    Executing transaction: done

    2.2 检验

    输入conda list,看到相应的版本变回与驱动对应的版本

    cudatoolkit               8.0                           3    https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
    cudnn                     7.0.5                 cuda8.0_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/ma

    2.3 tensorflow版本安装

    一般情况下,版本变动也需要重新安装tensorflow。以免程序报错。

    conda install tensorflow-gpu

     

     

    相关Linux及环境配置

    常用Linux指令汇总

    Linux中显卡用户管理相关应用及命令行

    macOS上运行python及配置相应环境

    macOS上用PyCharm本地配置Anaconda环境

    客户端配置Hadoop并运用SLURM GPU集群与HDFS文件系统

       SSH相关

    windows PC用SSH连接Ubuntu14.04的配置与方法

    macOS与CentOS之间互传文件(iTerm2与lrzsz)

    macOS系统用SSH链接CentOS服务器

       环境配置相关

    在CentOS 6.3上配置PyTorch与gcc

    CentOS 6.3安装anaconda并配置pytorch与cuda

    Ubuntu14.04安装Anaconda3-2018.12-x86_64

    运用Anaconda对python 3.6与tensorflow-gpu与pip环境配置

    虚拟环境中用Anaconda安装显卡CUDA驱动与CUDA运行版本匹配

    虚拟机上安装openCV

    macbook操作与快捷键个人查阅汇总

    docker安装及环境容器上传

     

    展开全文
  • ubuntu自带nouveau驱动会影响cuda安装,不当操作会导致黑屏和登陆循环。 查看信息:lsmod | grep nouveau 若有输出则没有被禁用 cd /etc/modprobe.d sudo gedit blacklist-nouveau.conf 文件中追加: ...

    GPU配置

    注意:如果只是想进行深度学习框架GPU版本的安装,安装完显卡驱动后,留意下驱动最大支持的CUDA版本,直接跳到Anaconda的安装,不需另外安装CUDA、cuDNN,因为Anaconda中已经自带了该包,conda会自己解决对应的CUDA、cuDNN的依赖的安装。

    1.安装NVIDIA显卡驱动

    # 1.卸载旧驱动
    sudo apt-get remove --purge nvidia*
    # 2.禁用nouveau驱动
    # 打开文件
    sudo gedit /etc/modprobe.d/blacklist.conf
    

    文尾添加内容:

    blacklist nouveau
    blacklist rivafb
    blacklist rivatv
    blacklist nvidiafb
    options nouveau modeset=0
    
    # 3.更新Linux系统内核
    sudo update-initramfs -u
    # 4.检查nouveau驱动是否成功被禁,命令无返回则是成功禁用。
    lsmod | grep nouveau
    # 5.安装驱动.run文件
    cd 下载目录
    sudo sh NVIDIA-Linux-x86_64-430.40.run -no-x-check -no-nouveau-check -no-opengl-files
    

    我这显卡相比原文就low了些哈哈哈。
    在这里插入图片描述
    PS:动态显示

    #GPU显存
    watch -n 10 nvidia-smi  #每10s更新一次
    #CPU、内存
    sudo apt-get install htop
    htop
    

    留意下对应版本关系,然后转到Anaconda安装

    2.CUDA安装

    开始之前了解一下版本依赖问题:

    2.1.显卡驱动版本与CUDA版本的对应关系

    在这里插入图片描述

    2.2.tensorflow-gpu版本与cuda版本的对应关系

    在这里插入图片描述

    2.3.开始安装

    nvidia-smi中信息得知 Drive Version:430.50 最大支持到CUDA:10.1
    考虑到之前入过一个坑,9.2的版本装对应的tensorflow-gpu报错,大体意思是缺少9.0版本,我还是装个整数的吧,CUDA10.0嘻嘻嘻。
    在这里插入图片描述
    执行sudo sh cuda_10.0.130_410.48_linux.run进行安装
    PS:驱动事先已经安过了,no
    在这里插入图片描述
    配置环境变量:
    打开profile文件 sudo gedit /etc/profile在文件末尾添加路径,也就是安装目录:

    export  PATH=/usr/local/cuda-10.0/bin:$PATH
    export  LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64$LD_LIBRARY_PATH
    

    保存,然后重启电脑: sudo reboot

    测试CUDA的例子:若显示关于GPU的信息,则说明安装成功了

    cd  /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
    sudo make
    ./deviceQuery
    

    成功后再声明环境变量
    打开gedit ~/.bashrc ,文尾追加:

    export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
    export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
    

    打开sudo gedit /etc/profile文尾追加:

    export PATH=/usr/local/cuda/bin:$PATH
    

    创建链接文件 sudo gedit /etc/ld.so.conf.d/cuda.conf 文尾添加:

    /usr/local/cuda/lib64
    

    执行 sudo ldconfig

    3.cuDNN的安装

    解压文件并进入cuda目录:

    tar -zxvf cudnn-10.0-linux-x64-v7.4.2.24.tgz 
     cd cuda/
    sudo cp lib64/lib* /usr/local/cuda/lib64/   
    sudo cp include/cudnn.h /usr/local/cuda/include/ 
    

    然后更新网络连接:请注意自己的版本号

    cd /usr/local/cuda/lib64/
    sudo chmod +r libcudnn.so.7.4.2
    sudo ln -sf libcudnn.so.7.4.2 libcudnn.so.7
    sudo ln -sf libcudnn.so.7 libcudnn.so
     
    sudo ldconfig
    

    测试cuDNN的例子:
    下载如下三个文件,并按照程序顺序安装(否则会报错

    在这里插入图片描述```python
    sudo dpkg -i libcudnn7_7.4.2.24-1+cuda10.0_amd64.deb
    sudo dpkg -i libcudnn7-dev_7.4.2.24-1+cuda10.0_amd64.deb
    sudo dpkg -i libcudnn7-doc_7.4.2.24-1+cuda10.0_amd64.deb

    
    将例子拷到家目录,否则执行会报错
    
    ```python
    cp -r /usr/src/cudnn_samples_v7/ /home/xu/
    cd ~/cudnn_samples_v7/mnistCUDNN/
    make clean && make
    ./mnistCUDNN 
    

    在这里插入图片描述

    展开全文
  • CUDA和NVIDIA ​ (1)CUDA是NVIDIA推出的用于自家GPU的并行计算框架,与NVIDIA的显卡驱动是两回事。...​ (3)所以最好先选择安装驱动,再安装相匹配的CUDA包 ​ tensorflow和 CUDA,NVIDIA对应的版本 ...

    CUDA和NVIDIA

    ​ (1)CUDA是NVIDIA推出的用于自家GPU的并行计算框架,与NVIDIA的显卡驱动是两回事。

    ​ (2)NVIDIA显卡驱动和CUDA并不具有一一对应的关系,可能有多个关系,只是离线安装的CUDA工具包(CUDA ToolKit)会默认携带与之匹配的最新的驱动程序。

    ​ (3)所以最好先选择安装驱动,再安装相匹配的CUDA包

    tensorflow和 CUDA,NVIDIA对应的版本

    展开全文
  • 安装需要驱动版本(需要查看以下显卡驱动和cuda的版本匹配cuda10.2支持440版本驱动,450驱动使用cuda11.0),这里以440版本驱动为例(安装时候是有440,写记录时候查看就没有了,诡异~~~~~): ...
  • 很多时候在搭建深度学习环境时候会纠结如何选择显卡驱动版本和CUDA版本问题,所以,为了更加方便找到相关信息,从NVIDIA官网截取下来了这个配置表,希望对大家有所帮助!! 官网链接:...
  • 注:笔记本带有显卡时,在Ubuntu系统...(opencv的编译选项中的CUDA需要匹配安装的cuda的算力,pytorch需根据对应的CUDA选择下载不同的下载命令) 一、用U盘安装ubuntu16.04、16.06系统 根据电脑位数下载ubuntu16.0...
  • 以ubuntu18.0.4为例,安装pytorch环境,会因为版本不一致导致程序无法正常运行,其中包括显卡驱动、cuda、cudnn、pytorch、python版本,但凡有一个不匹配,都会发生问题。1、安装显卡驱动显卡驱动处于最底层,被cuda...
  • 做一个笔记,防止经常找不到。
  • 写在前面:最近在装CUDA 9时想通过在官网下载 .run文件直接安装显卡驱动和cuda, 但是报错内核不匹配。在网上了解到ubuntu16.04系统对应内核版本应为4.4,而我现在版本比较高,所以需要内核版本回退。 一、卸载...
  • (1) 下载页有CUDA和cuDNN,依据CUDA版本选择cuDNN版本,然后依据系统选择对应文件; (2) CUDA和cuDNN版本匹配参考博文:GPU之CUDA&amp;amp;amp;cuDNN&amp;amp;amp;Tensorflow版本匹配 (...
  • 我用是win10系统,N卡,在家做科研,自己笔记本显卡差,但还是可以跑跑小训练,于是这里配置一下,准备动手! 然后遇到问题,需要升级cuda版本,如下图: 2、命令行测试:nvcc -V发现cuda版本9.0,好,那我去升级...
  • win7-64位cudnn的v7版本,匹配cuda8,懒的到nvidia注册账号的可以用这个,注意你的显卡能用哪个版本的cuda,查询网址https://developer.nvidia.com/cuda-gpus
  • 要配置NVIDIA显卡的CUDA和cudnn,各种版本之间的依赖关系以及与其他使用GPU的库版本兼容一直没有弄明白,最近经过多次卸载重装,终于成功配置好了显卡计算环境,于是把各个驱动程序和库之间的依赖关系理一下。...
  • 这是我第一次发博客,可能解释不是很详细,请多多包含一下,可以自己去官方下载相对应驱动,有些版本可能不匹配导致安装时候步骤也是不一样。下面就是我自己安装步骤以及版本型号。 安装显卡 移除原有...
  • nvidia setting 和nvidia model 与安装驱动不匹配,由于之前对于内核和驱动卸载和安装造成,所以输入nvidia -smi,一直不能出图片 解决: 1.卸载原来驱动 sudo apt-get remove --purge nvidia* 2....
  • 题外话:由于安装时候没怎么注意cuDNN和CUDA以及TensorFlow版本之间的匹配,导致安装过程不顺利。接下来,在安装之前我们先弄清这三者之间版本关系,,保证安装时候能顺利进行。 1) CUDA和与之相对应...
  • 装mmdetection环境一直报dataloader错误,是pytorch和cuda版本不匹配造成。 又由于显卡驱动版本太低,装不了高版本到cuda,所以干脆直接装cuda自带的显卡驱动。 1.关闭图形界面 ps aux | grep X sudo /etc/init....
  • 慢悠悠地装了很久,觉得CUDA和pytorch官网标注的当前该pytorch所匹配的CUDA应该是完全一致的,所以一开始就安装 10.1.105版本的CUDA,pytorch为1.4(官方说适配CUDA版本为10.1嘛~): 但是事实证明,不行。 最后...
  • 按照我第一篇博客安装,到最后安装完cuda后检查./deviceQuery 解决办法这种问题出现在cudn驱动问题导致,使得与显卡版本不匹配,这时候需要更新显卡驱动,重新解决一下。寻找合适驱动版本ubuntu-drivers ...
  • 查看本机显卡驱动版本 右击"桌面"------单击"NVIDIA控制面板"-... 在安装CUDA时,需要与本机显卡驱动版本进行匹配,否则会出错 具体可以见https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html ...

空空如也

空空如也

1 2 3 4 5 ... 11
收藏数 206
精华内容 82
关键字:

显卡匹配的cuda