精华内容
下载资源
问答
  • Nio 中 Selector 和 服务端 的对应关系是什么? Nio 中 Selector 和 服务端 的对应关系是什么
  • 高分悬赏的问题:axios 提交 post 请求时,axios post 请求类型和 SpringBoot 参数接收方式的对应关系是什么
  • linux根目录文件夹如下: [img=https://img-bbs.csdn.net/upload/201709/22/1506072375_274394.png][/img] df命令查看文件系统如下: [img=... 这里文件夹和文件系统对应关系是什么样的
  • SM,SP硬件结构 GRID,BLOCK,THREAD软件概念 从硬件角度讲,一个GPU由多个SM组成(当然还有其他部分),一个SM包含有多个SP(以及还有寄存器资源,shared memory资源,L1cache,scheduler,SPU,LD/ST单元...
    SM,SP是硬件结构
    GRID,BLOCK,THREAD是软件概念


    从硬件角度讲,一个GPU由多个SM组成(当然还有其他部分),一个SM包含有多个SP(以及还有寄存器资源,shared memory资源,L1cache,scheduler,SPU,LD/ST单元等等),1.x硬件,一个SM包含8个SP,2.0是32个,2.1是48个,3.0和3.5是192个。以及SP目前也称为CUDA CORE,而SM目前也称为MP,在KEPLER架构(SM3.0和3.5)下也称为SMX。


    从软件角度讲,CUDA因为是SIMT的形式,GRID,block,thread是thread的组织形式。最小的逻辑单位是一个thread,最小的硬件执行单位是thread warp(简称warp),若干个thread(典型值是128~512个)组成一个block,block被加载到SM上运行,多个block组成整体的GRID。

    这里为什么要有一个中间的层次block呢?这是因为CUDA通过这个概念,提供了细粒度的通信手段,因为block是加载在SM上运行的,所以可以利用SM提供的shared memory和__syncthreads()功能实现线程同步和通信,这带来了很多好处。而block之间,除了结束kernel之外是无法同步的,一般也不保证运行先后顺序,这是因为CUDA程序要保证在不同规模(不同SM数量)的GPU上都可以运行,必须具备规模的可扩展性,因此block之间不能有依赖。

    这就是CUDA的两级并行结构。

    总而言之,一个kernel对应一个GRID,该GRID又包含若干个block,block内包含若干个thread。GRID跑在GPU上的时候,可能是独占一个GPU的,也可能是多个kernel并发占用一个GPU的(需要fermi及更新的GPU架构支持)。

    block是resident在SM上的,一个SM可能有一个或多个resident blocks,需要具体根据资源占用分析。

    thread以warp为单位被SM的scheduler 发射到SP或者其他单元,如SFU,LD/ST unit执行相关操作,需要等待的warp会被切出(依然是resident 状态),以空出执行单元给其他warps。


    那么有问题 

    1. 1个block是不是只能resident在1个SM里
    2. GTX660ti的cuda core是1344,kepler架构,所以应该有7个SM,每个SM有192个SP,这么理解对吗?
    3. 在GTX660ti上跑一个kernel,如果block number为1,是不是gpu最多负载1/7,这么理解对吗?


    ice大神这样回复


    1:是的,您可以这样辅助考虑,如果一个block要使用shared memory,此时注意到shared memory是SM上的资源,不同的SM上shared memory是不通信的,也不能互相借用。所以,可以反证,一个block只能resident在一个SM上。

    2:kepler架构下的SM(又称SMX)是拥有192个SP(又称CUDA CORE)没错,因而使用总的SP数量除以192即得 SM数量。您的理解是正确的。

    3:这个问题说起来稍微有点复杂,因为这个和该block使用资源的情况有关,一般情况下,是无法达到1/7的,也就是说只上一个block的话很可能一个SM都跑不满,(比如这个block里面线程数量非常少,或者线程数量中等但是依然无法掩盖其他的延迟等)同时一个block最大只能有1024个线程,这对于GPU计算还是少了些。
    简单地借用一个数学的概念来说明可能更为明了:“1/7是您GPU占用率的‘上界’,但可能不是‘上确界(最小上界)’,同时,这样做一般来说线程数量太少,没有意义。”

    展开全文
  • 例如:mssqlserver安装的时候默认的数据库有四个,每个数据库的作用和每一个数据库里面表的大概用途。另外用户、角色能进入和如何管理访问、操作用户相应的数据库对象。另外创建一个数据库的时候里面有系统默认的表...
  • SM,SP硬件构结 GRID,BLOCK,THREAD软件念概 从硬件度角讲,一个GPU由多个SM构成(当然还有其他部份),一个SM含包有多个SP(以及还有寄存器资源,shared memory资源,L1cache,scheduler...

    最近应用开发的过程中出现了一个小问题,顺便记录一下原因和方法--数量线程

        SM,SP是硬件构结

        

        GRID,BLOCK,THREAD是软件念概

        

        

        

        从硬件度角讲,一个GPU由多个SM构成(当然还有其他部份),一个SM含包有多个SP(以及还有寄存器资源,shared memory资源,L1cache,scheduler,SPU,LD/ST单元等等),1.x硬件,一个SM含包8个SP,2.0是32个,2.1是48个,3.0和3.5是192个。以及SP现在也称为CUDA CORE,而SM现在也称为MP,在KEPLER构架(SM3.0和3.5)下也称为SMX。

        

        

        

        从软件度角讲,CUDA因为是SIMT的式形,GRID,block,thread是thread的组织式形。小最的逻辑单位是一个thread,小最的硬件执行单位是thread warp(简称warp),若干个thread(典型值是128~512个)构成一个block,block被加载到SM上行运,多个block构成团体的GRID。

        

        

        这里为什么要有一个间中的次层block呢?这是因为CUDA通过这个念概,供给了细粒度的通信段手,因为block是加载在SM上行运的,所以可以利用SM供给的shared memory和__syncthreads()能功现实线程同步和通信,这带来了很多处好。而block之间,除了结束kernel外之是没法同步的,一般也不证保行运先后顺序,这是因为CUDA序程要证保在不同范围(不同SM数量)的GPU上都可以行运,必须备具范围的可扩展性,因此block之间不能有依附。

        

        

        这就是CUDA的两级行并构结。

        

        

        总而言之,一个kernel对应一个GRID,该GRID又含包若干个block,block内含包若干个thread。GRID跑在GPU上的时候,是能可占独一个GPU的,也是能可多个kernel并发占用一个GPU的(要需fermi及更新的GPU构架持支)。

        

        

        block是resident在SM上的,一个SM可能有一个或多个resident blocks,要需体具根据资源占用分析。

        

        

        每日一道理
    古人云:“海纳百川,有容乃大。”人世间,不可能没有矛盾和争吵,我们要以磊落的胸怀和宽容的微笑去面对它 。哈伯德也曾说过:“宽恕和受宽恕的难以言喻的快乐,是连神明都会为之羡慕的极大乐事。”让我们从宽容中享受快乐,从谅解中体会幸福吧!

        thread以warp为单位被SM的scheduler 发射到SP或者其他单元,如SFU,LD/ST unit执行关相操纵,要需等待的warp会被切出(仍然是resident 状态),以空出执行单元给其他warps。

        

        那么有问题 

        1. 1个block是不是只能resident在1个SM里
    2. GTX660ti的cuda core是1344,kepler构架,所以应该有7个SM,每一个SM有192个SP,这么懂得对吗?
    3. 在GTX660ti上跑一个kernel,如果block number为1,是不是gpu最多载负1/7,这么懂得对吗?

        

        ice大神这样复兴

        

        1:是的,您可以这样帮助斟酌,如果一个block要应用shared memory,此时注意到shared memory是SM上的资源,不同的SM上shared memory是不通信的,也不能互相借用。所以,可以反证,一个block只能resident在一个SM上。

    2:kepler构架下的SM(又称SMX)是具有192个SP(又称CUDA CORE)没错,因而应用总的SP数量除以192即得 SM数量。您的懂得是确正的。

    3:这个问题说起来略微有点庞杂,因为这个和该block应用资源的情况有关,一般情况下,是没法到达1/7的,也就是说只上一个block的话极可能一个SM都跑不满,(比如这个block面里线程数量非常少,或者线程数量中等但是仍然没法盖掩其他的迟延等)同时一个block最大只能有1024个线程,这对于GPU算计还是少了些。
    单简地借用一个数学的念概来说明可能更为明白:“1/7是您GPU占用率的‘上界’,但可能不是‘上确界(小最上界)’,同时,这样做一般来说线程数量太少,没有意义。”

    文章结束给大家分享下程序员的一些笑话语录: PC软件体积大,是因为一个PC软件功能往往较多,能够满足你一个方面的需求,而一个iphone软件往往没几行代码,干一件很小的事情,自然需要的软件就多。就像吃西瓜和吃瓜子的来比数目,单位不同啊。

    转载于:https://www.cnblogs.com/xinyuyuanm/archive/2013/05/09/3069946.html

    展开全文
  • 就是在拖放控件的那个界面,的右下角有控件的尺寸,那个尺寸和实际窗口的尺寸的关系是什么?比如鼠标左键点击了窗口的右下角,CPoint对象中的值并不是按那个尺寸得到的值。求助!
  • 一交换机H3C与Quidway对应关系表 产品类别 双品牌并行销售 Quidway产品型号 H3C产品型号 高端机箱式交换机 Both Quidway S8512 H3C S9512 Both Quidway S8508 H3C S9508 Both Quidway S8508V H3C S9508V Both ...
  • 一般而言FPGA等效门数的计算方法有两种,一把FPGA基本单元(如LUT+FF,ESB/BRAM)和实现相同功能的标准门阵列比较,门阵列中包含 的门数即为该FPGA基本单元的等效门数,然后乘以基本单元的数目就可以得到FPGA门数...
  • SSL证书数字证书的一种,也称为SSL服务器证书,遵守SSL协议,由受信任的数字证书颁发机构CA,在验证服务器身份后颁发,具有服务器身份验证和数据传输加密功能。 所有的SSL证书都符合为Public Key Infrastructure ...

    SSL证书是数字证书的一种,也称为SSL服务器证书,遵守SSL协议,由受信任的数字证书颁发机构CA,在验证服务器身份后颁发,具有服务器身份验证和数据传输加密功能。

    所有的SSL证书都符合为Public Key Infrastructure (PKI) 制定的 ITU-T X509 国际标准,常见的SSL证书格式有:PKCS#7、PKCS#12 、DER 、PEM 、CER/CRT 、PFX 、P7B等。

    Web服务器一般指网站服务器,是指驻留于因特网上某种类型计算机的程序,可以处理浏览器等Web客户端的请求并返回相应响应,也可以放置网站文件,让全世界浏览;可以放置数据文件,让全世界下载。

    Web服务器目前最主流的Web服务器是Apache、 Nginx 、IIS、Tomcat。

    IIS:(Internet Information Services)是由微软公司提供的基于运行Microsoft Windows的互联网基本服务,安装SSL证书时需要用到的证书文件格式是cer、pfx。

    Cer、crt都是符合ITU-T X509 国际标准的DER编码(ASCII)的证书文件格式,目前不作为IIS的主流安装证书文件。

    Pfx格式证书文件是由 RSA 实验室与其它安全系统开发商为促进公钥密码的发展而制订的一系列标准,属于PKCS#12的常用后缀。并且是IIS服务器中使用率最高,安装效率最高的证书文件格式。

    Nginx:是一个高性能的HTTP和反向代理web服务器,安装SSL证书时需要使用到的证书文件格式是PAM编码(Base64)。

    PEM文本格式是以”—–BEGIN…”开头, “—–END…”结尾的,通常证书内会包含根证书、中间证书和用户证书的内容,但是并不包含key。

    Apache:可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件之一,安装SSL证书时需要使用到的证书文件格式是:Crt。

    Crt证书通常将根证书、中间证书和用户证书分开存放,上传到服务器后,修改配置文件即可。

    Tomcat是免费的开放源代码的Web应用服务器,是开发和调试JSP程序的首选,安装SSL证书时需要使用到证书文件格式是:jks。

    JKS是是基于二进制编码的证书格式,JKS证书通常将根证书、中间证书、用户证书和私钥合并存放并设置密码。

    证书颁发机构CA签发的证书通常是PEM格式或PKCS#7格式,而PKCS#12格式和JKS格式的证书需要进行证书格式转换才能得到。我们可以通过OpenSSL、Keytool或在线证书转换工具等方式将PEM格式或PKCS#7格式的证书转换为我们需要的其他格式。

    展开全文
  • 1、CHAR、VARCHAR 、LONGVARCHAR可映射为 String 或 char[],但 String 更适合于一般用法...3、BITBIT 类型的 Java 映射的推荐类型 Java 布尔型4、SMALLINTSMALLINT 类型的 Java 映射的推荐类型16位的 Java shor...

    1、CHAR、VARCHAR 、LONGVARCHAR

    可映射为 String 或 char[],但 String 更适合于一般用法

    2、BINARY、VARBINARY 和 LONGVARBINARY

    都可用同一 byte数组来表示。

    3、BIT

    BIT 类型的 Java 映射的推荐类型是 Java 布尔型

    4、SMALLINT

    SMALLINT 类型的 Java 映射的推荐类型是16位的 Java short 类型

    5、INTEGER

    INTEGER 类型 Java 映射的推荐类型是 Java int 类型。

    6、REAL

    REAL 类型的 Java 映射的推荐类型为 Java float 类型

    7、DOUBLE

    DOUBLE 类型的 Java 映射的推荐类型为 Java double 类型。

    8、FLOAT

    FLOAT 类型的 Java 映射的推荐类型为 Java double 类型。

    9、DECIMAL 、 NUMERIC

    DECIMAL 和 NUMERIC 类型的 Java 映射的推荐类型是 java.math.BigDecimal

    10、 DATE、TIME 、TIMESTAMP

    java.sql.Date,对应于 SQL DATE 信息。java.util.Date 基本类中的小时、分钟和秒都设为 0。

    java.sql.Time,对应于 SQL TIME 信息。java.util.Date 基本类中的年、月、日域设为 1970 年 1 月 1 日。这是 Java 纪元的“零”日期。

    java.sql.Timestamp,对应于 SQL TIMESTAMP 信息。该类扩展了 java.util.Date,添加了纳秒域。

    展开全文
  • 分享一个我的公众号,最近突然想玩小程序,之前做过一段时间前端开发,考虑到现在应用程序越来越多,未来社会一定一个充满“只有你想不到,没有你做不到”的App的世界!而微信小程序又给我们这群喜爱开发的童鞋们...
  • posePairs与mapIdx对应关系中同样的keypoint为什么是不同的值? flyfish //COCO的模型 const int kPoints = 18; //为每个关键点命名,一共18个,不包含背景 //鼻子-0, 脖子-1,右肩-2,右肘-3,右手腕-4,左肩-5,...
  • 关系数据库中的关系究竟是什么意思发布时间:2020-06-22 15:22:55来源:亿速云阅读:198作者:Leah关系数据库中的关系究竟是什么意思?针对这个问题,这篇文章给出了相对应的分析和解答,希望能帮助更多想解决这个...
  • MPU6050原始数据对应关系 1.陀螺仪 如下图, 陀螺仪范围 ...那么这个精度和范围的关系是什么? 首先MPU6050数据寄存器是一个16位的,由于最高位是符号位,故而数据寄存器的输出范围是-7FFF~7FFF ,也...
  • 首先这些对应关系是分单向和双向的 单向和双向有什么区别呢? 这个双向单向是面向对象的说法 意思就是你更新一个表另外一个表里面关联的数据跟着改变双向就是这两个表无论哪一个更新另外一个表都更新 单向就是只有...
  • 今天要讲的关于WPF的对应关系下拉框绑定事件,为什么要讲呢?因为现在在做的某一个功能需要用到这个,所以想分享给大家。 关于这个下拉框的问题就是,经理与部门的关系,当点击经理下拉框并选中好之后,它对应...
  • 什么是 API 级别? API 级别一个对 Android 平台版本提供的框架 API 修订版进行唯一标识的整数值。 体现为 android:targetSdkVersion等,即sdk版本或称固件版本。 对应关系 ...
  • 人际沟通与人际关系是什么 人际沟通是个人之间在共同活动中彼此交流思想、感情和知识等信息的过程,是人际关系的基本过程,人际沟通与人际关系是什么?下面是小编搜集整理的一些内容,希望对你有帮助。人际沟通是什么...
  • 三层架构与SSM框架的对应关系

    千次阅读 2020-02-06 17:27:13
    文章目录一、什么是框架二、三层架构与SSM框架的对应关系三、持久层技术解决方案1.JDBC技术2.Spring的JdbcTemplate3.Apache的DBUtils 一、什么是框架 框架软件开发中的一套解决方案,不同的框架解决的不同的...
  • Keil编译后的Code,RO,RW,ZI分别表示什么以及和芯片Flash、SRAM的对应关系 在使用keil开发STM32应用程序时,点击Build后在Build Output窗口中经常会有如下信息: <ignore_js_op>  以前一直好奇这...
  • 我直接上一个图(八卦与家庭成员关系对应表):而且如果你要研究八卦这个必须要记住的,懂了这个你“象”才能实际运用周易,否则你学到的永远都理论知识,所以今天我再告诉各位一个推导的方法。八卦代表的这个...
  • 域名和IP之间有什么关系 当用户在浏览器输入某个域名后,这个信息首先会到达提供这个域名的域名解析服务器上。域名解析器会解析出这个域名对应的IP, 所以域名IP的在网络上的另一种表现形式。 如何查看某个域名...
  • 文章目录三层架构与SSM之间的对应关系什么是框架(Framework)?使用框架的好处三层架构(表示层、业务层、持久层)SSM的三层架构图 什么是框架(Framework)? 框架(Framework)整个或部分系统的可重用设计,表现为...
  • 单片机采集的MPU6050原始数据对应关系

    万次阅读 多人点赞 2017-04-08 15:00:04
    单片机采集的MPU6050原始数据对应关系1.陀螺仪如下图,陀螺仪的范围有...那么这个精度和范围的关系是什么? 首先MPU6050数据寄存器是一个16位的,由于最高位是符号位,故而数据寄存器的输出范围是-7FFF~7FFF ,也既是-3
  • 转载自:Keil编译后的Code,RO,RW,ZI分别表示什么以及和芯片Flash、SRAM的对应关系 在使用keil开发STM32应用程序时,点击Build后在Build Output窗口中经常会有如下信息: <ignore_js_op> 以前一直好奇这几...
  • chromedriver下载地址 进入网站后找到想要的版本号 比如我这里需要的76这个版本,点进去 需要下载什么系统的就点哪个 ...查看版本对应关系就是点 notes.txt 这个文件里可以看到对应关系了 ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,946
精华内容 2,378
关键字:

对应关系是什么