精华内容
下载资源
问答
  • 1. Internal: failed initializing StreamExecutor for CUDA device ordinal 1: Internal: failed call to cuDevicePrimaryCtxRetain: CUDA_ERROR_UNKNOWN: unknown error——(不设置os或者是os设置了多张显卡...

    记录一个在服务器上使用tensorflow-gpu报错的debug过程


    总结

    碰到如下两个错误:

    1. Internal: failed initializing StreamExecutor for CUDA device ordinal 1: Internal: failed call to cuDevicePrimaryCtxRetain: CUDA_ERROR_UNKNOWN: unknown error——(不设置os或者是os设置了多张显卡VISIBLE并且包含问题显卡时报该错误)

    2. RuntimeError: CUDA runtime implicit initialization on GPU:0 failed. Status: all CUDA-capable devices are busy or unavailable——(os只设置了问题显卡VISIBLE时报该错误)

    并且确定GPU没有被占满,理应是可以用的,于是利用 os.environ['CUDA_VISIBLE_DEVICES'] 逐张显卡测试,最终发现当'1'号GPU是VISIBLE的时候就会报错。

    初步判定问题为GPU出了问题

    解决方法:利用 os.environ['CUDA_VISIBLE_DEVICES'] 避开出问题的显卡。当不设置该参数的时候程序默认是可以看到所有显卡,自然会看到出问题的卡而导致程序报错。


    具体整个tensorflow配置过程以及debug过程

    conda的镜像源设置如下(北外的镜像源,亲测十分好用):

    channels:
      - defaults
    custom_channels:
      conda-forge: https://mirrors.bfsu.edu.cn/anaconda/cloud
      msys2: https://mirrors.bfsu.edu.cn/anaconda/cloud
      bioconda: https://mirrors.bfsu.edu.cn/anaconda/cloud
      menpo: https://mirrors.bfsu.edu.cn/anaconda/cloud
      pytorch: https://mirrors.bfsu.edu.cn/anaconda/cloud
      simpleitk: https://mirrors.bfsu.edu.cn/anaconda/cloud
    default_channels:
      - https://mirrors.bfsu.edu.cn/anaconda/pkgs/main
      - https://mirrors.bfsu.edu.cn/anaconda/pkgs/r
      - https://mirrors.bfsu.edu.cn/anaconda/pkgs/msys2
    show_channel_urls: True
    

    在服务器上用以下conda命令安装了tensorflow-gpu

    conda install tensorflow-gpu

    安装的版本是 tensorflow 2.4.1 + cudatoolkit 10.1

    运行以下代码测试GPU是否可用:

    import tensorflow as tf
    
    print(tf.test.is_gpu_available())

    报错:

    Internal: failed initializing StreamExecutor for CUDA device ordinal 1: Internal: failed call to cuDevicePrimaryCtxRetain: CUDA_ERROR_UNKNOWN: unknown error

    后来使用os.environ指定GPU再尝试测试:

    import tensorflow as tf
    import os
    
    os.environ['CUDA_VISIBLE_DEVICES']='0,1,2'  # 三张GPU
    print(tf.test.is_gpu_available())

    仍然报同样的错误,于是打算逐张卡测试

    import tensorflow as tf
    import os
    
    os.environ['CUDA_VISIBLE_DEVICES']='0' # '1','2'
    print(tf.test.is_gpu_available())

    '0'和'2'都没问题,输出True

    而测试'1'卡的时候报了如下错误:

    RuntimeError: CUDA runtime implicit initialization on GPU:0 failed. Status: all CUDA-capable devices are busy or unavailable

    因此初步判定是1号GPU出问题了

     

    展开全文
  • StarUML version: 4.0.0 之前因为这个试了不少解决方案, 最后发现官方手册有说明: To install an extension manually: 1.Get an extension as a .zip file. 2.Extract the file on the extensions path. ...

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CvTls25n-1629786573507)(https://i.stack.imgur.com/ACngH.png)]
    StarUML version: 4.0.0

    之前因为这个试了不少解决方案, 最后发现官方手册有说明:

    To install an extension manually:
    1.Get an extension as a .zip file.
    2.Extract the file on the extensions path.
    	/Users/<user>/Library/Application 	Support/StarUML/extensions/user for Mac OS.
    	C:\Users\<user>\AppData\Roaming\StarUML\extensions\user for Windows.
    	~/.config/StarUML/extensions/user for Linux.
    3.Check a folder in the extensions path and :file:main.js file in the folder.
    4.Restart StarUML.
    

    如:

    1. 官网 Extension有链接, GitHub下载release版本

    2. 复制, 解压

    3. 重启即可, 官方手册永远滴神
      在这里插入图片描述

    展开全文
  • 问题:在mysql创建完表后,导入excel数据,excel数据和表字段是对应的,没有问题,但是导入向导》选择表后》选择目标表》下一步的时候报错 解决:我是重启了premium,再次尝试就不报错了 原因:我在执行这个操作...

    问题:在mysql创建完表后,导入excel数据,excel数据和表字段是对应的,没有问题,但是导入向导》选择表后》选择目标表》下一步的时候报错

    解决:我是重启了premium,再次尝试就不报错了

    原因:我在执行这个操作的时候,premium在执行表数据新增,可能是线程进程占用问题

    展开全文
  • cobbler profile 查看配置信息列表 [root@192 kickstarts]# cobbler profile list CentOS-7-i386 [root@192 kickstarts]# cobbler profile edit --name=CentOS-7-i386 --kickstart=/var/lib/cobbler/kickstarts...

    cobbler profile 查看配置信息列表

    [root@192 kickstarts]# cobbler profile list
    
       CentOS-7-i386
    
    [root@192 kickstarts]# cobbler profile edit --name=CentOS-7-i386 --kickstart=/var/lib/cobbler/kickstarts/centos-7.cfg

     

    展开全文
  • 出现的问题: 在mysql创建完表后,导入excel数据,excel数据和表字段是对应的,没有问题,但是导入向导》选择表后》选择目标表》下一步的时候报错: 解决:我是重启了premium,再次尝试就不报错了 ...
  • 出现场景: 在centos7.3中安装openstack-glance服务,启动openstack-glance-api.service 时报错。
  • LookupError: unknown encoding: utf-8

    千次阅读 2021-05-30 05:36:56
    python打包后运行exe报错:LookupError: unknown encoding: utf-8 pip uninstall enum34 命令卸载掉enum34 这个包,然后删掉之前打包生成的所有文件,重新进行打包就好了。
  • Error:Internal error: (java.net.MalformedURLException) unknown protocol: jrt java.net.MalformedURLException: unknown protocol: jrt at java.net.URL.(URL.java:421) at java.net.URL.(URL.java:310) at ...
  • Attempting to fetch value instead of handling error Internal: failed to get device attribute 13 for device 0: CUDA_ERROR_UNKNOWN: unknown error 问题来源:Python安装tensorflow执行时出现问题。 问题产生...
  • UNKNOWN ERROR 诡异错误

    千次阅读 2018-05-08 08:52:05
    #include using namespace std; struct Long { int *s; Long() { s=new int[5]; memset(s,0,20); } ~Long() { delete[] s; } void operator=(const Long &A) { delete[] s; s=new i
  • 原因是证书的导出方式不对,如图,之前是导出“专用密钥”,导出的也是p12文件,但是没法用 要导出“证书”才行 这样子导出的就可以用了,亲测! 转载于:https://my...
  • 今天安装k8sV1.16的版本时候,执行突然发现命令不对,之前安装...unknown flag: --experimental-upload-certs,将–experimental-upload-certs 替换为 --upload-certs [root@k8s-master opt]# kubeadm init --confi...
  • django.db.utils.InternalError :(1054, “Unknown column ‘bititle’ in fiels list”) 想起了之前在mysql数据库里修改了bititle字段名,所以“bititle”字段在数据库里但是通过python查不到 但是django框架里的...
  • 在学习scrapy框架的时候遇到问题。运行代码如下错误:File 'lxml.etree.pyx' ...... File 'serializer.pxi'....... 我最终找到报错的原因,就是lxml的版本太低了。之前装了lxml2.2。换了最新的lxml就能跑了
  • Attempting to fetch value instead of handling error Internal: failed to get device attribute 13 for device 0: CUDA_ERROR_UNKNOWN: unknown error 查了一下说是要去英伟达官网下载新的驱动,一通操作比较...
  • CUDNN_STATUS_INTERNAL_ERROR解决方法

    千次阅读 2019-07-23 18:55:11
    tf调试中出现CUDNN_STATUS_INTERNAL_ERROR等错误 E tensorflow/stream_executor/cuda/cuda_dnn.cc:359] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR E tensorflow/stream_executor/cuda/cuda_dnn...
  • @[TOC](记一次强制关机之后idea导致项目不能启动(Error:Internal error: (java.lang.IllegalArgumentException) Argument for ) 我的错误发生的原因是因为今天我的电脑太卡了,所以强制重启,话不多说直接上错误...
  • Even if you’re not using MyISAM tables, you should still set it to 8-64M as it will also be used for internal temporary disk tables. key_buffer_size=8M Size of the buffer used for doing full table ...
  • sql = f''' insert into `t_datav`(category,paper_id,title,allcount,joincount,score,paper_create_time) values( "mock",{id},{title},{allcount},{joincount},{score},{create_time})...
  • 但是,今天我爱模板网在使用它进行日期验证的时候出了问题,报Error in event handler for "el.form.change": "TypeError: value.getTime is not a function"的错误: 代码如下: js验证码的代码: 从上面...
  • 这个错误很让我迷惑,因为无论是数据库还是Django的配置上,我的名字都一摸一样,而且数据库中创建该数据库,但就是报1049错误。再经过一系列百度后,发现原来是自己之前安装的禅道占用了端口,只需要停止禅道服务...
  • sqlalchemy.exc.InternalError: (pymysql.err.InternalError) (1170, “BLOB/TEXT column ‘teacher’ used in key specification without a key length”) 这个是指你该表单里面的某一column的格式问题,比如这个...
  • 1、在cmd里面启动appium 2、执行用例之后提示图片中的内容 3、去powershell升级了appium版本 4、重新执行用例的时候,手机会提示重新安装appium工具,安装之后就好了。 ...
  • Attempting to fetch value instead of handling error Internal: failed to get device attribute 13 for device 0: CUDA_ERROR_UNKNOWN: 问就是显卡内存太次了。。新开terminal然后重试吧。 555 该换了...
  • django.db.utils.InternalError: (1054, "Unknown column 'tb_users.default_address_id' in 'field list'") ERROR basehttp 124 "GET /info/ HTTP/1.1" 500 237741 错误分析: 一般此提醒为新建或修改模型代码后,...
  • INTERNALERROR>pluggy.manager.PluginValidationError: unknown hook 'pytest_namespace。 其他情况也有可能报这个错误,这里推荐一个方法,新建虚拟环境。不保证能够解决全部此类问题。 作者自己是排除了模块...
  • gerrit-3.1.5+nginx(jdk1.8.0_11),但是在填写:New email address时提示:Error 500 (Server Error): Internal server error Endpoint: /account/self/emails/*; 然后在Gerrit中的error_log中有关于 Error:...
  • C++ 错误解决 —— internal compiler error

    万次阅读 2018-07-10 16:48:28
    问题:g++ 编译时,报错:g++: internal compiler error: Killed (program cc1plus)出错原因:出错的原因是(虚拟机)运行内存不足,而大量template的扩展需要足够的内存。解决:方法1:若是在虚拟机上,关掉虚拟机...
  • django迁移模型常见错误django.db.utils.InternalError: (1050, “Table ‘django_content_type’ already exists”)” 这个问题经常出现在迁移模型时报错,表示该表已经存在,说明之前进行过模型的迁移操作。 例如...
  • pymysql.err.InternalError: (1054, "Unknown column 'N190731130957864287' in 'where clause'") 一般是格式化字符串的时候没加引号。 错误示例: 正确示例:在 %s处加双引号即可 pymysql.err.InternalError: ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 32,173
精华内容 12,869
关键字:

errorinternalunknown