精华内容
下载资源
问答
  • 安装gputensorflow

    千次阅读 2019-03-25 20:28:53
    linux服务器安装gputensorflow 本人尝试在linux服务器安装gputensorflow,在此记录一下我的安装过程。 1. 确定服务器的gpu型号 1、安装gputensorflow需要先安装cuda,而cuda是nvidia显卡厂商推出的运算平台...

    linux服务器安装gpu版tensorflow

    本人尝试在linux服务器安装gpu版tensorflow,在此记录一下我的安装过程。

    1. 确定服务器的gpu型号

    1、安装gpu版tensorflow需要先安装cuda,而cuda是nvidia显卡厂商推出的运算平台。所以只有配置了nvidia的显卡的服务器才能安装gpu版tensorflow。否则只能装cpu版本的。
    在服务器输入:

    lspci | grep -i vga
    

    奇怪的是只看到了Matrox(迈创)的显卡,而没有显示NVIDIA的显卡。
    奇怪的是只显示了迈创的显卡,没有显示NVIDIA的显卡
    于是看能不能查N卡的详细信息:

    lspci | grep -i nvidia
    

    可以看到具体的N卡型号 Tesla K40m
    可以看到具体的显卡型号 Tesla K40m
    2、查看nvidia的gpu计算性能
    N卡的计算性能≥3.0才可以安装gpu版tensorflow,具体计算性能可查 https://blog.csdn.net/taoqick/article/details/79171199
    参考:https://blog.csdn.net/wang03989/article/details/83026756

    综合1+2:我的显卡是合格的。

    2. NVIDIA驱动安装

    根据以上所查N卡型号,选择驱动,https://www.nvidia.cn/Download/index.aspx?lang=cn
    在这里插入图片描述
    安装方式,网上有详述,笔者装的时候,显卡已经装了驱动,在此不说。
    验证是否安装成功:

    nvidia-smi
    

    如下显示了详细的nidia显卡信息和使用情况,即表明驱动安装成功。记住下表中的驱动版本号 367.48,这个信息后面选CUDA需要用到。

    注意:笔者安装的时候,由于 Tesla K40m选择的驱动,默认同时安装了cuda8.0,和cudnn??,所以后续应该是不需要了??(笔者后面检查全部安装了,也不知道是不是课题组其他人之前安装的)。只需要验证是否安装成功即可。其他的版本,按下面继续操作。

    3. CUDA选择与安装

    3.1 CUDA选择

    https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/#overview中有下表可以查看安装对应的CUDA版本
    在这里插入图片描述
    根据上面驱动版本号 367.48,应选择CUDA8.0(8.0.44),8.0的对应有两个版本,后续页面可以看到,此版本会写作CUDA8.0(GA1)
    https://developer.nvidia.com/cuda-toolkit-archive选择对应版本CUDA8.0(GA1)
    在这里插入图片描述
    接着会跳到另一个界面,令人痛苦的选择又开始了,CUDA的选择又与操作系统、架构、操作系统版本有关
    在这里插入图片描述

    3.2 查看操作系统架构、发行版本来选择CUDA

    一步步来,首先,操作系统是Linux的,这很好选,但Architecture(架构)是什么呢?

    3.2.1 查操作系统架构Architecture

    1 、一般输入:

    dmidecode | grep "Product"
    

    但是我的输入后查不到
    在这里插入图片描述
    2、再做尝试输入:

    uname -a
    

    3、或者:

    uname -r
    

    就查到了信息,可能是服务器型号不同吧,浪潮系列的也许可以用第一个代码查到,我的是Sun Microsystems研发操作系统 solaris?所以只能用第二个查?
    在这里插入图片描述
    上图可知Architecture处应该选择X86_64,也可看到对应linux的Distribution(发行版本)是Debian 3.16.43-2,而选项中并没有对应Debian的,但可以选择按 Ubuntu16.04 来选择。

    4、也可以输入:(此命令只适合于ubuntu和debian的发行版)

    dpkg --print-architecture
    

    下图显示为64位,amd64即为x86_64
    在这里插入图片描述

    3.2.2 查操作系统的发行版本Dstribution

    上面在查操作系统架构时,已经显示了发行版本。然而对于有些版本,在以上命令中,可能不会显示出来,这时可以输入:

    lsb_release -a
    

    图中可以看到具体的发行版本信息:
    在这里插入图片描述

    3.2.3 下载安装方式的选择

    选择runfile(local)本地安装方式,下载到对应安装位置。按下图提示run就可以了。
    在这里插入图片描述

    3.3 CUDA安装

    1、在安装界面中,可参照下图进行选择。记住第二个一定选择no:
    在这里插入图片描述
    2、添加环境变量,安装结束后,在管理员用户根目录下,找到.bashrc文件并打开,在最后添加下面三行文本,保存退出即可
    在这里插入图片描述
    3、测试安装是否成功:
    重启终端后输入:

    nvcc -v
    

    若显示以下信息,则安装成功:
    在这里插入图片描述

    4. 安装cudnn

    4.1 选择cudnn版本

    1、cuDNN是做深度学习必备的库,但是下载时候需要注册用户才能下载,而且网页速度较慢,建议从CSDN上找资源来下载。cuDNN的各种版本可以从 https://developer.nvidia.com/rdp/cudnn-archive 这里下载cuDNN各个版本。

    2、 cuDNN下载之后是个压缩包,解压后文件夹名也为cuda(并非上面安装的cuda文件夹)里面包含头文件夹cuda/include和封装好的库cuda/lib64,按下面的方式拷贝:(以下usr/local/cuda是上面的cuda的安装路径,建议cudnn下载在另外位置,然后进入此文件位置,再按下图解压、复制等操作)

    3、注意事项:
    仔细看完下面的注意事项再操作
    a)下载后,如果压缩包不是.tgz格式,请将其重命名为.tgz格式。
    b)有的博客说有软链接的问题,可能是有的安装方法并不将解压后的lib64复制到cuda的lib64文件夹下,而是直接链接过去。
    参考: https://blog.csdn.net/lucifer_zzq/article/details/76675239
    c)如果安装过别的版本的cudnn,因不兼容问题,还应将其他版本的libcudnn.*文件删除。
    https://blog.csdn.net/ture_dream/article/details/52677619
    https://www.cnblogs.com/alexanderkun/p/6908191.html
    d)还有重置cudnn.h的读写权限问题
    https://www.cnblogs.com/go-better/p/7625541.html
    https://blog.csdn.net/lucifer_zzq/article/details/76675239
    网上说法各不相同,我也挺懵的,大家还是按照实际操作为准。
    以下sudo为mac操作系统,linux的操作系统去掉sudo即可
    在这里插入图片描述

    4.2 测试cudnn是否安装成功

    输入:

    cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
    

    显示版本号为cudnn 6.0.21
    在这里插入图片描述

    5 安装tensorflow

    准备:先安装python,再安装annocoda和包管理器、环境配置等,这些网上都有教程。
    有pip的可以直接输入:

    pip install tensorflow-gpu
    

    测试:
    参考
    https://blog.csdn.net/taoqick/article/details/79171199

    6 困惑

    6.1 是否装好了?

    本人用pip装后,import tensorflow直接报错,即原来的cpu版都用不了了,gpu版也没用不了。于是pip uninstall将其卸载。

    今天想起我的环境也可以用conda装包,于是试了下conda install tensorflow-gpu,装好后 import tensorflow,可以继续执行,conda list 命令的列表中两种版本的tensorflow都包含,也许装好了?
    在这里插入图片描述
    在这里插入图片描述
    从上图conda list可以看到,cuda版本为9.2,cudnn版本为7.2.1,与之前所查不一样。
    分析原因,可能是:
    ①课题组服务器是一个账号下分为多个子账号使用,根目录下装有python和pip装包集成工具,和tensorflow。不同的人子账户下又各自安装了自己的环境,且版本各不相同。也许以上查看到的都是根目录下的版本。其中有些命令可能查的是所有的。
    ②我自己的账户下装了anaconda,也许我子账户的装包命令是conda?
    ③还有就是软链接的问题,查到的cudnn版本为6.0.21,也许是指向cudnn7.2.1的。这个没有太弄明白,详见:
    https://blog.csdn.net/qq_40549291/article/details/82773269

    6.2 驱动版本与cuda的实际版本

    令笔者困惑的另外一点是,按照我的N卡型号 Tesla K40m来选择,如果cuda toolkit选择8.0,则所推荐的驱动版本为384.66,但为何我查到的确是 367.48?按照 conda list来看,cuda有不是8.0版本,而是9.2。而且如果选择cuda9.2版本,对应得到推荐的驱动应该是396.82,也不应该是查到的367.48
    https://www.nvidia.cn/Download/index.aspx?lang=cn
    在这里插入图片描述

    展开全文
  • 用不了说是忽视了我的GPU,计算能力是2.1,而GPU支持要求最低计算能力是3.0,但 是我在官网上查的我的GPU是3.0的计算能力啊,哪位大神能告诉我怎么办?如何设置可 以使用我的gpu?详情如图。![图片说明]...
  • 使用anaconda安装gpu版本tensorflow 1、在anaconda prompt 创建虚拟环境 conda create tensorflow2 2、下载tensorflow(直接下载最新版)(要保证cuda的版本是否ok) pip install tensorflow-gpu 3、激活虚拟环境 ...

    使用anaconda安装gpu版本tensorflow

    1、在anaconda prompt 创建虚拟环境

    conda create tensorflow2
    

    2、下载tensorflow(直接下载最新版)(要保证cuda的版本是否ok)

    pip install tensorflow-gpu
    

    3、激活虚拟环境

    activate tensorflow2
    

    4(1)、下载后出现错误—使用清华镜像

    Anaconda An HTTP error occurred when trying to retrieve this URL.HTTP errors are often intermittent,
    

    清华镜像网址:
    https://mirror.tuna.tsinghua.edu.cn/help/anaconda/

    在这里插入图片描述

    4(2)、解决上面问题后
    conda env list
    查看此时conda里存在的虚拟环境

    但是在jupyter和speder里依然显示没有tensorflow
    直接以管理员身份运行prompt

    大概是因为tensorflow只在虚拟环境tensorflow2 中
    但是jupyter和speder所在的base里并没有
    所以在base里再安装一次

    conda install -n base tensorflow
    

    在这里插入图片描述

    成功!!!

    展开全文
  • 在Aistudio中使用GPUtensorflow

    千次阅读 2020-05-12 16:56:38
    在Aistudio中使用GPUtensorflow在Aistudio中使用GPUtensorflow查看显卡驱动查看显卡驱动对应的cuda版本选择cudnn版本号下载cuda和cudnn在aistudio上配置和安装导入安装与解压修改权限和配置环境配置python安装tf...

    在Aistudio中使用GPU跑tensorflow

    我试了好多方法在aistudio上用tf都是用的cpu在跑,这个方法也是借鉴了网上很多人写的博客,我把需要下载的东西都放在百度云里了,方便大家使用。

    查看显卡驱动

    使用命令行nvidia-smi查看显卡驱动。到目前位置我是见到有两种驱动,一种是418的一种是396的。在这里插入图片描述
    在这里插入图片描述

    查看显卡驱动对应的cuda版本

    网址:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
    因为显卡驱动是向下兼容的,所以按照道理应该找396版本驱动对应的cuda安装,才能保证以后在无论打开了那个版本的GPU都可以正常使用。所以可以选择安装9.2一下版本的cuda。

    在这里插入图片描述

    选择cudnn版本号

    这里还是附上网址:https://tensorflow.google.cn/install/source#linux

    在这里插入图片描述
    这里就发现了一个很坑爹的问题了,百度的Aistudio内置的是python3.7,支持python3.7的tensorflow-gpu只有1.13和1.14,但是他们要求的cuda版本是10,这就很坑爹了有没有,aistudio的显卡只支持9.2一下的cuda,但是又配了一个3.7的python,这就摆明了不想让我们白嫖百度的显卡跑tensorflow啊!!
    不过没关系,python3.6也可以后续安装,先把cuda装好,后续的事情慢慢来。
    最终我选择了使用tensorflow-gpu-1.12.0版本,对应的cudnn的版本号是7,对应的cuda版本号是9。

    下载cuda和cudnn

    附上网址吧:
    cuda下载地址:https://developer.nvidia.com/cuda-toolkit-archive

    在这里插入图片描述
    反正显卡驱动向下兼容,这里我就选用上面表里说明的下载cuda9.0吧。
    cudnn下载地:https://developer.nvidia.com/rdp/cudnn-archive
    下载前需要注册登录,老黄的垃圾网站,又卡又没有中文!
    cudnn需要和linux系统版本对应,查看linux版本

    在这里插入图片描述
    这里选择对应的cudnn版本下载就可以了。
    这里附上这两个东西的百度云:链接:https://pan.baidu.com/s/1EOKPs5hTzZDv-bP1VFaoOw
    提取码:4f2d
    名字太长了,我稍微改了一下。

    在aistudio上配置和安装

    导入

    在aistudio中创建数据集,将刚才下载好的两个文件传进来。在这里插入图片描述
    在这里插入图片描述
    上传完以后在载入aistudio时勾选这个数据集,然后进入aistudio。
    在终端中输入

    cp /home/aistudio/data/data34586/cuda9_0linux.run /home/aistudio
    cp /home/aistudio/data/data34586/cudnn9_0.tgz home/aistudio
    

    将数据集拷贝进来,下次打开时就可以把挂载的数据集取消掉了。

    安装与解压

    先新建一个文件夹:

    mkdir cuda9
    

    安装cuda:

    sh cuda9_0linux.run --silent --toolkit --toolkitpath=$HOME/cuda9
    

    解压下载的cudnn,默认会解压到cuda文件夹中:

    tar -zxvf cudnn9_0.tgz
    

    解压把cudnn的指定文件copy到cuda安装文件对应的目录中:

    cp cuda/include/cudnn.h cuda9/include/
    cp cuda/lib64/libcudnn* cuda9/lib64/
    

    修改权限和配置环境

    在终端里输入:

    chmod a+r ~/cuda9/include/cudnn.h
    chmod a+r ~/cuda9/lib64/libcudnn*
    vi ~/.bashrc
    

    点击键盘i开启编辑模式,在打开文件的最后加入:

    export PATH=/home/aistudio/cuda9/bin${PATH:+:${PATH}}
    
    export LD_LIBRARY_PATH=/home/aistudio/cuda9/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
    
    export CUDA_HOME=/home/aistudio/cuda9
    
    

    然后esc再:wq保存退出。
    再输入:

    source  ~/.bashrc
    

    配置python

    在终端输入:

    conda create -n env_name python=3.6
    
    source activate env_name
    

    安装tf

    在终端输入:

    pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==1.12.0
    

    保存环境

    配置好虚拟环境之后压缩

    conda info --env
    tar -zcvf /home/aistudio/env_nmae.gz /opt/conda/envs/env_name
    

    重启aistudio后,解压压缩的虚拟环境

    tar -zxvf env_nmae.gz
    conda create -n new_env --clone opt/conda/envs/env_name
    

    最终效果

    在这里插入图片描述
    最后看一下效果,模型确实在使用GPU在跑,成功!

    展开全文
  • conda 安装GPUtensorflow

    2020-09-05 14:55:10
    conda 安装GPUtensorflow conda create -n tensorflow python=3.6 conda activate tensorflow conda install tensorflow-gpu

    conda 安装GPU版tensorflow

    conda create -n tensorflow python=3.6
    conda activate tensorflow 
    conda install tensorflow-gpu
    
    展开全文
  • 使用GPU训练TensorFlow模型

    千次阅读 2019-09-29 17:16:24
    查看GPU-ID CMD输入: nvidia-smi ...如果电脑多个GPUTensorflow默认全部使用。如果想只使用部分GPU,可以设置CUDA_VISIBLE_DEVICES 命令行输入: # 指定采用1号GPU运行*.py CUDA_...
  • tensorflow-gpu==1.x 只有CPU cpu运行 和tensorflow一样运行 有GPU且装Cuda和Cudnn cpu运行 gpu运行 有GPU未装Cuda或Cudnn cpu运行 和tensorflow一样运行 在tensorflow 2.x中, 环境 ...
  • 用GPU进行TensorFlow计算加速

    千次阅读 2018-03-06 15:35:22
    为了加速训练过程,本文将介绍如何如何在TensorFlow使用单个GPU进行计算加速,也将介绍生成TensorFlow会话(tf.Session)时的一些常用参数。通过这些参数可以使调试更加方便而且程序的可扩展性更好。本文选自...
  • conda安装gpu版本tensorflow

    千次阅读 2019-12-19 19:50:12
    windows10安装cuda10.2 配置国内清华镜像源 创建环境 conda create -n tensorflow ...安装gpu版本的tensorflow,conda安装会把cuda/cudnn都安装 conda install tensorflow-gpu==1.14 若成功,重试几次或十来次或...
  • 参考文章: 使用GPU 训练Tensorflow/Keras 的CNN模型 https://blog.csdn.net/xiaozisheng2008_/article/details/80558914 tensorflow显存管理、tensorflow使用多个gpu训练 ......
  • 使用GPU加速TensorFlow机器学习

    千次阅读 2018-04-07 11:36:49
    在Thinkpad X260上运行一个CNN图像分类的样例程序时,发现速度特别慢,迭代...TensorFlow目前只支持NVIDIA显卡,笔者手头没有,阿里云上有GPU计算型ECS,便“按量付费”买了一台,开始了一场“坎坷小贵”的验证之旅...
  • Linux查看GPUtensorflow指定GPU

    千次阅读 2018-05-16 22:02:01
    查看GPU 命令: nvidia-smi 功能:显示机器上gpu的情况 命令: nvidia-smi -l 功能:定时更新显示机器上gpu的情况 ...指定GPU ...os.environ["CUDA_VISIBLE_DEVICES"] = "0" # 使用第一块GPU(从0...
  • 关于配置tensorflow-gpu,以及cuda和cudnn的匹配,见: https://blog.csdn.net/weixin_44684139/article/details/88387996 但是由于我是RTX2070显卡,可能借鉴意义不是特别大,总而言之就是: tensorflow版本——...
  • keras 调用 GPUtensorflow-GPU)心得

    千次阅读 2019-08-23 11:24:55
    keras 调用 GPUtensorflow) 1. os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID" os.environ["CUDA_VISIBLE_DEVICES"] = "0" #选用GPU序号 2.问题 若无法调用,可以重新建立一个虚拟环境,安装cuda,安装与...
  • 网上介绍的大多很复杂,又喜欢用到pip啊pip3之类的...conda install tensorflow-gpu 特别说明:( 先source activate激活环境,它会根据python版本来安装对应的tensorflow版本 )  2,安装librosa conda instal
  • 本文主要是介绍在Ubuntu系统下安装torch-gpu版和tensorflow-gpu版. 配置 因为两者均是GPU版本和python版,因此所需要的配置环境几乎一模一样。 在正式安装torch和tensorflow之前,需要安装以下软件: 安装cuda...
  • Windows10下GPU版本TensorFlow安装问题汇总
  • Win10在conda虚拟环境下pip安装GPUTensorFlow1.11.0 目录Win10在conda虚拟环境下pip安装GPUTensorFlow1.11.0安装包下载虚拟环境创建进入安装tensorflow_gpu解压cuDNN以及配置环境变量测试 半个月前...
  • 1.前提:本机已安装tensorflow-gpu 2.检测: import tensorflow as tf sess=tf.Session(config=tf.ConfigProto(log_device_placement=True)) 3.目的: 查看日志信息,若包含gpu信息,就是使用gpu。 其他方法:跑...
  • 其中包含了所需的软件和地址(但可能与我的电脑并相配,我的GTX1050TI的) ...Python:这里使用的Python3.6,Anaconda包括了Python和一些相对应的库,非常方便使用,所以这里使用的是相对应的版本为Anaconda3 5.1...
  • 测试 GPU-tensorflow AnacondaPrompt 输入 activate python35 #激活python3.5版本环境,具体取决于自己命名情况,的是 activate tensorflow python # 可执行阶段 import tensorflow as tf # 测试 hello =tf....
  • GPU 配置tensorflow虚拟环境

    千次阅读 2018-05-31 00:06:17
    1)创建虚拟环境 conda create -n py36 python=3.5 2) 安装ananconda conda install anaconda 3)激活环境 source activate py36 4)查找最新端适用tensorflow版本 ...thomasantony/tensorflow_gpu...
  • #禁用gpu版本TensorFlow,因为CUDA号码从0开始,这里直接让CUDA使用-1的GPU,自然就无法使用gpu了。 代码前面加入: import osos.environ["CUDA_VISIBLE_DEVICES"]="-1" import tensorflow as tfEnvironment ...
  •   一直天真的以为学校服务器上面有gpu就可以自动的照着gpu版本的跑了,但是每次发现输出信息中的device都显示是cpu,虽然速度是比我的电脑快,但batchsize=8跑个6000张的图像一轮就要2小时,感觉不大对劲。...
  • 环境要求: Windows python 3.5 pip 9.0.1 tensorflow 0.12.0 cuda8.0 cudnn5.1 ...注意一台主机要么装cpu-TensorFlow,要么装gpu-tensorflow,否则极容易报错,这是本人走过最大的错误!!本...
  • gputensorflow测试

    万次阅读 2018-06-06 10:48:18
    import tensorflow as tf with tf.Session(config=tf.ConfigProto(allow_soft_placement=True, log_device_placement=False)) as sess: a = tf.constant(1) b = tf.constant(3) c = a + b ...
  • Windows安装GPU版本TensorFlow

    千次阅读 2017-10-15 11:01:42
    4、TensorFlow’安装 5、Tflearn安装方法1: 6、TensorBoard安装 安装之前建议先上TensorFlow看看各个模块的版本要求,免得走弯路:https://www.tensorflow.org/install/install_windows 可见CUDA的版本要求是...
  • 记一次服务器上配置GPU版本tensorflow的经历 早就耳闻tensorflow-gpu与CUDA,cudnn三者之间版本匹配很复杂,今天算是见识到了。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 73,687
精华内容 29,474
关键字:

有gpu但是tensorflow用不了