linux查找gpu_gpu linux - CSDN
  • ~$ lspci | grep -i vga 01:00.0 VGA compatible controller: NVIDIA Corporation GF119 [GeForce GT 610] ...如果你想看gpu的详细信息,使用~$ lspci -v -s 01:00.0,则: 01:00.0 VGA compatible controller: NVIDI

    ~$ lspci | grep -i vga
    01:00.0 VGA compatible controller: NVIDIA Corporation GF119 [GeForce GT 610] (rev a1)

    如果你想看gpu的详细信息,使用~$ lspci -v -s 01:00.0,则:
    01:00.0 VGA compatible controller: NVIDIA Corporation GF119 [GeForce GT 610] (rev a1) (prog-if 00 [VGA controller])
        Subsystem: Device 7377:0000
        Flags: bus master, fast devsel, latency 0, IRQ 27
        Memory at fb000000 (32-bit, non-prefetchable) [size=16M]
        Memory at d0000000 (64-bit, prefetchable) [size=128M]
        Memory at de000000 (64-bit, prefetchable) [size=32M]
        I/O ports at ef00 [size=128]
        [virtual] Expansion ROM at fc000000 [disabled] [size=512K]
        Capabilities: <access denied>
        Kernel driver in use: nouveau
        Kernel modules: nvidiafb, nouveau

    展开全文
  • nvidia-smi是用来查看GPU版本信息,GPU使用信息查询: nvidia-smi 第一栏的Fan:N/A是风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会...

    nvidia-smi是用来查看GPU版本信息,GPU使用信息查询:
    nvidia-smi
    在这里插入图片描述
    第一栏的Fan:N/A是风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会返回转速,因为它不依赖风扇冷却而是通过其他外设保持低温(比如我们实验室的服务器是常年放在空调房间里的)。

    第二栏的Temp:是温度,单位摄氏度。
    第三栏的Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
    第四栏下方的Pwr:是能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。
    第五栏的Bus-Id是涉及GPU总线的东西,domain?device.function
    第六栏的Disp.A是Display Active,表示GPU的显示是否初始化。
    第五第六栏下方的Memory Usage是显存使用率。
    第七栏是浮动的GPU利用率。
    第八栏上方是关于ECC的东西。
    第八栏下方Compute M是计算模式。
    下面一张表示每个进程占用的显存使用率。

    显存占用和GPU占用是两个不一样的东西,显卡是由GPU和显存等组成的,显存和GPU的关系有点类似于内存和CPU的关系。我跑caffe代码的时候显存占得少,GPU占得多,师弟跑TensorFlow代码的时候,显存占得多,GPU占得少。

    查看GPU型号

    lspci | grep -i nvidia

    查看NVIDIA驱动版本

    sudo dpkg --list | grep nvidia-*

    展开全文
  • Linux查看显卡信息:lspci | grep -i vga使用nvidia GPU可以:lspci | grep -i nvidia前边的序号 "00:0f.0"是显卡的代号(这里是用的虚拟机);查看指定显卡的详细信息用以下指令:lspci -v -s 00:0f.0Linux...

    Linux查看显卡信息:

    lspci | grep -i vga

    使用nvidia GPU可以:

    lspci | grep -i nvidia



    前边的序号 "00:0f.0"是显卡的代号(这里是用的虚拟机);

    查看指定显卡的详细信息用以下指令:

    lspci -v -s 00:0f.0


    Linux查看Nvidia显卡信息及使用情况

    Nvidia自带一个命令行工具可以查看显存的使用情况:

    nvidia-smi



    表头释义: 

    • Fan:显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A; 
    • Temp:显卡内部的温度,单位是摄氏度;
    • Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;
    • Pwr:能耗表示; 
    • Bus-Id:涉及GPU总线的相关信息; 
    • Disp.A:是Display Active的意思,表示GPU的显示是否初始化; 
    • Memory Usage:显存的使用率; 
    • Volatile GPU-Util:浮动的GPU利用率;
    • Compute M:计算模式; 

    下边的Processes显示每块GPU上每个进程所使用的显存情况。


    如果要周期性的输出显卡的使用情况,可以用watch指令实现:

    watch -n 10 nvidia-smi

    命令行参数-n后边跟的是执行命令的周期,以s为单位。


    展开全文
  • 一、服务器型号 命令: cat /etc/redhat-release 二、CPU 命令: 查看CPU统计信息:lscpu 查看CPU型号:cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c 查看物理CPU个数:cat /proc/cpuinfo| grep ...

    一、服务器型号

    • 命令:
      cat /etc/redhat-release

    二、CPU

    • 命令:
      • 查看CPU统计信息:lscpu
      • 查看CPU型号:cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c
      • 查看物理CPU个数:cat /proc/cpuinfo| grep “physical id”| sort| uniq| wc -l
      • 查看每个物理CPU中core的个数(即核数):cat /proc/cpuinfo| grep “cpu cores”| uniq
      • 查看逻辑CPU的个数:cat /proc/cpuinfo| grep “processor”| wc -l

    三、内存

    • 命令:
      • 查看概要内存使用情况:free -h
      • 查看内存详细使用情况:cat /proc/meminfo

    四、硬盘

    • 命令:
      • 查看硬盘和分区分布:
        • lsblk
        • df -h

    五、显卡

    • 命令:
      查看所有显卡:lspci | grep -i vga
    展开全文
  • 纯裸机安装GPU环境: 一路踩坑倒腾一下午 记录下方便后人可以在半小时内完成的事情不用花上一天研究,写的不明白的可以留言,但是比较懒不经常上。。。 症状:nvidia-smi命令显示command not found 简化避坑版: ...

    纯裸机安装GPU环境:

    一路踩坑倒腾一下午 记录下方便后人可以在半小时内完成的事情不用花上一天研究,写的不明白的可以留言,但是比较懒不经常上。。。
    症状:nvidia-smi命令显示command not found

    简化避坑版:
    安装版本推荐(NVIDIA 384.183版本 + CUDA 9.0 + cudnn 7.1 )
    切换到root账户
    1.先安装NVIDIA驱动
    安装kernel :
    先查看型号: uname -r
    sudo yum install  kernel-devel.x86_64 0:3.10.0-957.10.1.el7(后面的是型号)
    官网查找驱动对应版本:https://www.nvidia.com/Download/index.aspx?lang=cn
    wget http://cn.download.nvidia.com/tesla/396.82/NVIDIA-Linux-x86_64-396.82.run
    (由于安装必须在root账户 因此下载前先切到root账户
    图形界面选择是 一路选择默认的yes or no 即可
    启动nvidia-smi 查看是否安装成功

    2.安装cuda
    找到合适的cuda版本 https://developer.nvidia.com/cuda-downloads
    在提示选择是否装驱动的时候 选择no
    cuda 环境路径配置
    vim  ~/.bashrc 
    添加如下三行:
    export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
    export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
    export CUDA_HOME=/usr/local/cuda-9.0
    source ~/.bashrc  

    3.安装cudnn
    解压cudnn压缩包,并移到cuda目录
    tar -zxvf cudnn***(下载的特定版本)
    sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
    sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d 
    sudo chmod a+r /usr/local/cuda/include/cudnn.h
    sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

    4.安装tensorflow验证
    安装版本 tensorflow-gpu==1.8.0
    import tensorflow as tf
    sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
    出现gpu相关信息即可

    坑:
    1.由于tensorflow-gpu 1.8.0 目前只能支持 配套的cuda 9.0 其中 9.2 不行 只有9.1可以,安装方式是先查好版本,以免到最后一步发现版本不能匹配
    2.tensorflow 和 tensorflow-gpu 不能同时安装,否则会报错,解决方法:
    pip uninstall tensorflow
    pip uninstall tensorflow-gpu
    pip uninstall protobuf
    pip install tensorflow 
    3.安装nvidia驱动是报错kernel ,有两个原因,一个是由于安装的nvidia版本不匹配,另一个是由于 nouveau禁用问题
    lsmod | grep nouveau 查看,如果没有出现任何问题则禁用成功否则如下:
    vim /usr/lib/modprobe.d/dist-blacklist.conf
    加上
    blacklist nouveau
    options nouveau modeset=0
    然后 备份镜像
    mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r)-nouveau.img  
    dracut /boot/initramfs-$(uname -r).img $(uname -r)  
    重启 reboot 

    如果你想了解我踩了那些坑,往下看,否则下面对你来说都是废话  没什么卵用

    ++++++先安装cuda (姿势错误)++++++
    (找到合适的cuda版本 https://developer.nvidia.com/cuda-downloads)
    wget https://developer.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda-repo-rhel7-10-1-local-10.1.105-418.39-1.0-1.x86_64.rpm
    yum install cuda

    之后启动nvidia-smi:
    NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

    sudo yum install nvidia*(这一步貌似并没有成功安装驱动,因为重启还是找不到)
    sudo yum install  kernel-devel.x86_64 0:3.10.0-957.10.1.el7(后面的是型号)
    ++++++++++++以上可以忽略+++++++++++++++++

    于是,安装驱动:(讲道理 驱动应该第一步安装。。。)
    找到对应的版本:lspci | grep -i nvidia(查看显卡型号)
    官网查找对应版本:https://www.nvidia.com/Download/index.aspx?lang=cn
    wget http://cn.download.nvidia.com/tesla/396.82/NVIDIA-Linux-x86_64-396.82.run
    (由于安装必须在root账户 因此下载前先切到root账户
    图形界面选择是 一路选择默认的yes or no 即可

    nvidia-smi 出现gpu信息 ok
    测试cuda安装是否 ok 否则卸载重新安装对应的cuda 版本
    卸载不成功。。。直接安装9.2版本
    sudo sh cuda_9.2.148_396.37_linux.run
    下载run文件 重新安装对应的9.2版本。。注意加上.run 后缀 下下来的文件缺少后缀
    cat /usr/local/cuda/version.txt 查看版本 是否为9.2 done

    找到cuda9.2对应的 cudnn
    https://developer.nvidia.com/rdp/cudnn-archive
    需要账号密码登录才能下载 用jumper传文件

    解压cudnn压缩包,并移到cuda目录
    tar -zxvf cudnn***(下载的特定版本)
    sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
    sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d 
    sudo chmod a+r /usr/local/cuda/include/cudnn.h
    sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

    测试以上是否安装成功 tensorflow调用查看是否成功启用gpu
    sudo pip install tensorflow-gpu==1.8.0
    import tensorflow as tf
    报错
    ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
    各种姿势尝试后发现 貌似不支持9.2版本,自尽。。。
    重新安装9.0!!!!
    方法同上 从nvidia驱动开始(384.81版本!!!!!!) =====
    然后重装cuda(9.0)
    cuda 环境路径配置
    vim  ~/.bashrc 
    添加如下三行:
    export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
    export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
    export CUDA_HOME=/usr/local/cuda-9.0
    source ~/.bashrc  
    最后是cudnn(7.4.1)
    sudo cp cuda/include/cudnn.h /usr/local/cuda-9.0/include/
    sudo cp cuda/lib64/libcudnn* /usr/local/cuda-9.0/lib64/ -d 
    sudo chmod a+r /usr/local/cuda-9.0/include/cudnn.h
    sudo chmod a+r /usr/local/cuda-9.0/lib64/libcudnn*

    pip uninstall tensorflow
    pip uninstall tensorflow-gpu
    pip uninstall protobuf
    pip install tensorflow 

    坑:官网下载的nvidia版本为384.183余cuda还是不能完全匹配 cuda自带的diver又无法启用nvidia-smi功能 
    但是383.81下载的版本无法成功安装
    最后 先安装cuda之后 卸载其本身安装的384.81版本再去安装384.183版本 成功启动。。

    安装tensorflow-gpu即可:
    注意安装tensorflow-gpu之后不用再安装tensorflow 否则会冲突报错

    验证方法:
    import tensorflow as tf
    sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
    出现gpu相关信息即可

    出现kernel 报错:
    是由于 nouveau禁用问题
    lsmod | grep nouveau 查看
     vim /usr/lib/modprobe.d/dist-blacklist.conf
     加上
    blacklist nouveau
    options nouveau modeset=0

    展开全文
  • Linux安装TensorFlow-GPU==1.14.0版本 1.首先确保linux环境干净以及没有tensorflow 2.常规安装TensorFlow方法 直接使用pip3 install tensorflow -i https://pypi.douban.com/simple安装即可 一: 首先 登入NVIDIA查找...
  • linux查看gpu nvidia的使用状态命令:  nvidia-smi
  • sudo fuser -v /dev/nvidia* 转载于:https://www.cnblogs.com/huangshiyu13/p/7383657.html
  • 原文:https://www.binarytides.com/linux-get-gpu-information/ 译文: 您需要找到正确的型号和供应商的图形卡在您的系统上,能够安装适当的驱动程序,并使硬件功能正常。大多数现代linux发行版可以检测各种显卡...
  • 1.查看cpu命令行输入:top则会输出: 上图第三行就是cpu的使用情况. 参数解释: us:用户空间程序的cpu使用率 sy:系统空间的cpu使用率,主要是内核程序 ni:用户空间且通过nice调度过的程序的cpu使用率 ...
  • 2020/05/19 我们在服务器上跑代码最常用的就是NVIDIA显卡,如GTX2080,下面记录一下我找到的常用代码。 在NVIDIA显卡可以正常使用以后,输入 nvidia-smi 就可以看到一个包含每张显卡型号、显存使用情况、利用...
  • free -mfree -m total used free shared buff/cache available Mem: 128831 15666 23617 406 89547 111448 Swap: 130986
  • 1. 永久挂载机械硬盘的方法:  首先得到/dev/sda3这个分区的UUID,... Ubuntu Linux 永久挂载(mount)分区  然后,我们按照/etc/fstab文件中的格式添加一行如下内容:  UUID=904C23B64C23964E /media/aborn/data...
  • 查看内存和CPU$ free -m #单独查看内存使用情况$ top #查看内存及...$ htop #查看内存及CPU使用情况查看GPU$ nvidia-smi #查看一次 $ watch -n 1 nvidia-smi #实时查看,1秒刷新1次$ pip install gpustat $ watch --co
  • 查找 GPU 计算能力

    2019-07-12 10:54:57
    你能在这里找到你的 GPU 的计算能力:  https://en.wikipedia.org/wiki/CUDA#Supported_GPUs ------------------------------------------------------------------------------------------------------- ...
  • 1. Docker: 是一个开源的应用容器引擎,可以让开发者打包自己的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化。容器是完全适用沙箱机制,相互之间不会有任何接口。中文名...
  • 获取进程的进程号,如18173 进入/proc/18173/,18173是上面的进程号 执行命令ls -alh | grep exe,exe链接的目标就是启动路径
  • 1、查看服务器上的cuda和cudnn版本 cat /usr/local/cuda/version.txt cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 ...2、查找能对应安装的tensorflow版本 3、我遇到的问题: 之前讲python的版...
  • 查看CPU、GPU相关信息

    2020-01-07 17:24:24
    针对于NVIDIA系列GPU,可以通过查看/proc/driver/nvidia/目录下的相关文件查看GPU信息,具体来说: 使用ls /proc/driver/nvidia/gpus命令查看目录下有什么文件,比如题主这里为: 根据上一步查看到的文件信息...
  • GPU 命令行释放内存

    2017-12-21 10:25:41
    我们在使用tensorflow+pycharm 写程序的时候, 有时候会在控制台终止掉正在运行的程序...sudo fuser -v /dev/nvidia* #查找占用GPU资源的PID 因为我们只有一块显卡,所以显示如下图所示: 可以看到我们的nvidia0上还有一
1 2 3 4 5 ... 20
收藏数 7,085
精华内容 2,834
关键字:

linux查找gpu