精华内容
参与话题
问答
  • Fp4autl.dll,Fpencode.dll,Fp4awel.dll

    千次下载 热门讨论 2010-10-06 00:01:17
    安装office2007提示: windows installer 服务不能更新一个或多个受保护的windows文件问题解决. 下载这三个文件保存到对应的路径,即可正常安装.
  • 基于Apriori、FP-Growth及Eclat算法的频繁模式挖掘源程序 一、DataMiningApriori程序 用eclipse打开,把三个测试数据mushroom、accidents和T10I4D100K放置 在F:\DataMiningSample\FPmining文件夹下面,即可运行 二、...
  • FILE *fp; int i,a[6]={1,2,3,4,5,6},k; fp=fopen("data.dat","w+"); for(i=0;i;i++) { fseek(fp,0L,0); _ _ fprintf(fp,"%d\n",a[i]);__ } rewind(fp); _ fscanf(fp,"%d",&k);_ fclose(fp); _printf("%d...
  • fprintf(fp,"%-10s%-10s%-10s%-10s\n",person->name,person->num,person->dor,person->group);scanf("%s",person->name); } fclose(fp); } void readfile() //文件读取函数 { printf("\n请输入文件名:\n"); ...
  • 里面包含一个可实现的fp-growth的实现代码和一个pptx的讲解和一个存在问题的展示
  • FP-Growth算法之FP-tree的构造(python)

    千次阅读 2015-07-04 00:18:33
    前言:关于 FP-Growth 算法介绍请见:FP-Growth算法的介绍。 本文主要介绍 FP-tree 的构造算法,关于伪代码请查看上面的文章。上接:FP-Growth算法python实现;下接:FP-Growth算法之频繁项集的挖掘(python)。 ...

    暂未更新。

    展开全文
  • cuda-fp16 api调用问题

    2016-07-07 09:22:49
    我想使用半精度计算,目前运行环境是win7 64位,gpu是泰坦x,我想尝试调用 cuda_fp16.h 里的__hisnan()、__hadd()等函数。 调用: const half KZero = __float2half(0.0); const half aa = __float2half(1.0); ...
  • 数据挖掘进阶之关联规则挖掘FP-Growth算法 绪 近期在写论文方面涉及到了数据挖掘,需要通过数据挖掘方法实现软件与用户间交互模式的获取、分析与分类研究。主要涉及到关联规则与序列模式挖掘两块。关联规则挖掘使用...

    数据挖掘进阶之关联规则挖掘FP-Growth算法

    近期在写论文方面涉及到了数据挖掘,需要通过数据挖掘方法实现软件与用户间交互模式的获取、分析与分类研究。主要涉及到关联规则与序列模式挖掘两块。关联规则挖掘使用基于有趣性度量标准的FP-Growth算法,序列模式挖掘使用基于有趣性度量标准的GSP算法。若想实现以上优化算法,首先必须了解其基本算法,并编程实现。关键点还是在于理解算法思想,只有懂得了算法思想,对其进行优化操作易如反掌。源代码方面,其实是自己从网络中查找并进行阅读,在理解的基础上进行优化。下面首先介绍一下基本的FP-Growth算法的实现过程:

    原理介绍

    基本思路:不断地迭代FP-tree的构造和投影过程。

    对于每个频繁项,构造它的条件投影数据库和投影FP-tree。对每个新构建的FP-tree重复这个过程,直到构造的新FP-tree为空,或者只包含一条路径。当构造的FP-tree为空时,其前缀即为频繁模式;当只包含一条路径时,通过枚举所有可能组合并与此树的前缀连接即可得到频繁模式。

    算法实现

    本算法采用Java实现,主要根据序列模式的情况,算法共有2个类:

    MyFptree类:算法核心类。FP-Growth算法的核心操作:建树挖掘频繁项操作都在这里实现。在使用该算法时,也是需要通过使用该类的方法来实现GSP算法。

    TreeNode2类:元素类。在本算法实现中,元素类中含有元素属性集,在使用时也是使用该属性。另外,在该类中还封装了对元素的操作以及一些其他操作。

    有关源码请点击下载

    有关序列模式挖掘的GSP算法,详见鄙人博客中“数据挖掘进阶之序列模式挖掘GSP算法”一文。

    展开全文
  • fp16和fp32

    千次阅读 2019-10-07 13:05:11
    1)TensorRT的FP16与FP32相比能有接近一倍的速度提升168,前提是GPU支持FP16(如最新的2070,2080,2080ti等) 2)减少显存。 缺点: 1) 会造成溢出 因此,在日常使用过程中,常使用双混合精度训练。如图: ...

    float : 1个符号位、8个指数位和23个尾数位

     

    利用fp16 代替 fp32

    优点:

    1)TensorRT的FP16与FP32相比能有接近一倍的速度提升168,前提是GPU支持FP16(如最新的2070,2080,2080ti等)

    2)减少显存。

     

    缺点:

    1) 会造成溢出

     

    因此,在日常使用过程中,常使用双混合精度训练。如图:

    此过程中的技术:

    1) Loss scaling  :会存在很多梯度在FP16表达范围外,我们为了让其落入半精度范围内,会给其进行等比放大后缩小。

    流程:

     

     

    展开全文
  • Nvidia GPU的浮点计算能力(FP64/FP32/FP16)

    万次阅读 多人点赞 2017-10-16 15:20:26
    ​​其实说到浮点计算能力,首先得区分不同精度的浮点数,虽然Linpack测试里只关心双精度的浮点计算能力,但在其他领域,有时候反而会更加关注单精度甚至是半精度的浮点计算能力。 ...半精度、单精度、双精度...

    转自:http://weibo.com/ttarticle/p/show?id=2309403987017473113077

    ​​其实说到浮点计算能力,首先得区分不同精度的浮点数,虽然Linpack测试里只关心双精度的浮点计算能力,但在其他领域,有时候反而会更加关注单精度甚至是半精度的浮点计算能力。

    半精度、单精度、双精度这些概念是在IEEE 754标准里定义的,浮点计数是利用浮动小数点的方式使用不同长度的二进制来表示一个数字,与之对应的是定点数。同样的长度下浮点数能表达的数字范围相比定点数更大,但浮点数并不能精确表达所有实数,而只能采用更加接近的不同精度来表达。单精度的浮点数中采用4个字节也就是32位二进制来表达一个数字,双精度浮点数采用8个字节也就是64bits来表达,当然半精度浮点数也就是采用16bits了。因为采用不同位数的浮点数的表达精度不一样,所以造成的计算误差也不一样,对于需要处理的数字范围大而且需要精确计算的科学计算来说,就要求采用双精度浮点数,而对于常见的多媒体和图形处理计算,32位的单精度浮点计算已经足够了,对于要求精度更低的机器学习等一些应用来说,半精度16位浮点数就可以甚至8位浮点数就已经够用了。

    CPU和GPU最大的不同在于内部计算单元数量的差异以及处理方式的不同,CPU内部的核心数较少而且设计上更倾向于顺序串行处理数据,GPU则因为只需要支持相对单一的数据类型和计算方式,所以计算单元较小但数量更多而且更倾向于并行处理数据。一个简单的比较是现在的Intel CPU最多也就支持24核但GPU则动不动就支持几千个核了。

    CPU vs GPUCPU vs GPU

    对于浮点计算来说,CPU可以同时支持不同精度的浮点运算,但在GPU里针对单精度和双精度就需要各自独立的计算单元,一般在GPU里支持单精度运算的Single Precision ALU称之为FP32 core或简称core,而把用作双精度运算的Double Precision ALU称之为DP unit或者FP64 core,在Nvidia不同架构不同型号的GPU之间,这两者数量的比例差异很大。

    Nvidia GPU Architecture evolutionNvidia GPU Architecture evolution

    在第三代的Kepler架构里,FP64单元和FP32单元的比例是1:3或者1:24

    第四代的Maxwell架构里,这个比例下降到了只有1:32

    第五代的Pascal架构里,这个比例又提高到了1:2,但低端型号里仍然保持为1:32

    这种比例在这些GPU的架构图表现也非常明显,比如下面Tesla P100采用的GP100架构图中,用黄色标记的DP Unit和绿色的Core比例很明显就是1:2,所以P100的单精度性能和双精度性能也相差了一倍。

    Nvidia Pascal P100 ArchitectureNvidia Pascal P100 Architecture

    GPU的浮点计算理论峰值能力测试跟CPU的计算方式基本一样,

    理论峰值 = GPU芯片数量*GPU Boost主频*核心数量*单个时钟周期内能处理的浮点计算次数,

    只不过在GPU里单精度和双精度的浮点计算能力需要分开计算,以最新的Tesla P100为例:

    双精度理论峰值 = FP64 Cores * GPU Boost Clock * 2 = 1792 *1.48GHz*2 = 5.3 TFlops

    单精度理论峰值 = FP32 cores * GPU Boost Clock * 2 = 3584 * 1.58GHz * 2 =  10.6 TFlops

    因为P100还支持在一个FP32里同时进行2次FP16的半精度浮点计算,所以对于半精度的理论峰值更是单精度浮点数计算能力的两倍也就是达到21.2TFlops 。

    Nvidia的Tesla P100基本也代表了如今GPU的最强性能,双精度5.3TFlops的计算能力也确实能秒掉采用Intel最高端E7 v4 CPU的四路X86服务器了,虽然这个理论峰值计算里面采用的GPU核心频率是Boost后的主频,相比一般计算CPU理论峰值计算能力时采用的基本主频来说并不太公平,但即使去掉Boost后提升的11%性能,单个Tesla P100的浮点计算能力也还是超过当前最高端的4路E7 v4服务器的3TFlops 了。

    Tesla P100是Tesla系列里面最新的产品,相比前两代采用Kepler架构的K40和Maxwell架构的M40两款产品来说,P100不仅在单精度浮点计算性能超过前两代产品,双精度浮点性能相比Kepler更有3倍多的提升,相比Maxwell就更是高到不知道哪里去了。这三者详细的参数对比可以看下表

    K40 vs M40 vs P100K40 vs M40 vs P100

    Nvidia的GPU产品主要分成3个系列产品,分别面向不同的应用类型和用户群体,这三个系列产品分别是:

    1.主要面向3D游戏应用的GeForce系列,几个高端型号分别是GTX1080、Titan X和GTX980,分别采用最新的Pascal架构和Maxwell架构,因为面向游戏玩家,对双精度计算能力没有需求,所以双精度计算单元只有单精度计算单元的1/32,但同时也因为受众群体较大,出货量也大,单价相比采用相同架构的Tesla系列产品要便宜很多,也经常被用于机器学习

    Nvidia GeForceNvidia GeForce

    2.面向专业图形工作站应用的Quadro系列,主要是针对CAD、3DMaxs、Maya这一类的设计软件做过驱动层的优化,因为针对专业用户人群,出货量少,所以采用相同架构的Quadro售价比GeForce高出许多,也很少有人会拿它去用作别的用途

    3.专用GPU加速计算的Tesla系列,Tesla本是第一代产品的架构名称,后来演变成了这个系列产品的名称了,最新的第五代架构名为Pascal,对应的产品型号就是前面提到的P100。而采用前两代架构Kepler和Maxwell的产品目前也还在销售,分别对应K系列和M系列的产品,目前市面上常见的也就是K40/K80、M4/M40/M60等几个型号。K系列更适合用作HPC科学计算,M系列则更适合机器学习用途。

    另外Nvidia还有一个专门针对虚拟化环境应用的GRID GPU产品,目前只有K1和K2两个型号,同样采用Kepler架构,实现了GPU的硬件虚拟化,可以让多个用户共享使用同一张GPU卡,适用于对3D性能有要求的VDI或云环境下多租户的GPU加速计算场景。K1上集成了4颗入门级的Kepler GPU,支持的CUDA核心数量较少只有768核,但提供更大的总显存容量16GB,K2则集成了2颗高端的Kepler GPU,支持3072个CUDA核心数,显存容量虽然较少只有8GB但因为采用GDDR5相比K1的DDR3提供更高的带宽能力。

    Nvidia GRID K1&K2Nvidia GRID K1&K2

    以两者中性能更好的K2来看,使用了2颗Kepler GK104 的GPU芯片,每个GK104的GPU内含1536个FP32 CUDA Core和64个FP64  Units (24:1)

    单精度浮点数 理论峰值 = 2 GPU * 1536 FP32 Core * 2 * 745MHz  = 4.58TFlops

    双精度浮点数 理论峰值 = 2 GPU * 64 FP64 core * 2 * 745MHz = 0.19TFlops


    展开全文
  • 我的CUDA核函数中只使用了INT32和FP32的数据类型,可是在用NVprofiler拿到的profiling中: ![图片说明](https://img-ask.csdn.net/upload/201708/14/1502708584_799483.png) 却看到使用了FP64执行单元。 请问,这是...
  • FP-growth算法

    2017-11-08 21:09:50
    demo 代码:传送门引言上次...而本次分享的FP-growth(frequent patten)算法就能高效地发现频繁项集。 那么在现实生活中,是否存在应用FP-growth算法的产品呢?答案是存在的,如下图所示: 上图中,我们在Google搜
  • 假阳性(FP): 实际为负,预测为正 假阴性(FN): 实际为正,预测为负; 对于二分类问题,这个比较清楚。但是对于多分类问题,我仍旧比较迷糊。 比如: y_true = [0,1,2,0,1,2] y_pred = [0,2,1,0,0,1] 此时:...
  • FP算法

    万次阅读 2011-10-17 22:13:51
    Apriori算法和FPTree算法都是数据挖掘中的关联规则挖掘算法,处理的都是最简单的单层单维布尔关联规则。 转自http://blog.csdn.net/sealyao/article/details/6460578 Apriori算法 Apriori算法是一种最有影响的...
  • FPgrowth

    2017-04-18 10:05:41
    ************************FPgrowth概述和apirior的比较*********************************  频繁项集挖掘算法用于挖掘经常一起出现的item集合(称为频繁项集),通过挖掘出这些频繁项集,当在一个事务中出现频繁...
  • 人脸数据集:CFP

    2018-11-07 16:37:59
    人脸数据集CFP:CFP consists of 500 subjects each with 10 frontal and 4 profile images. The evaluation protocol includes frontal-frontal (FF) and frontal-profile (FP) face verification, each ...
  • fwrite(&f1, sizeof(int), 1, fp); fwrite(&f2, sizeof(int), 1, fp); for (i = 0; i ; i++) { f1 = f1+f2; f2 = f1+f2; fwrite(&f1, sizeof(int), 1, fp); fwrite(&f2, sizeof(int), 1, fp); } ...
  • fp16与fp32简介与试验

    千次阅读 2020-05-02 01:38:42
    一、fp16和fp32介绍 fp16是指采用2字节(16位)进行编码存储的一种数据类型;同理fp32是指采用4字节(32位); 如上图,fp16第一位表示+-符号,接着5位表示指数,最后10位表示分数; 公式: 其中,sign位...
  • 关联规则—Apriori算法—FPTree

    万次阅读 多人点赞 2018-07-19 13:58:56
    1 关联规则 2 频繁项集(Frequent Itemset) 3 关联规则Association Rule 4 关联规则评估指标 5 关联规则挖掘方法: 6 关联规则 Apriori 算法 ▶ 关联规则新指标: [Math Processing Error]liftlift 值 ...
  • 关联规则挖掘FP方法

    千次阅读 2006-12-23 20:36:00
    fp-tree的整个介绍:http://www.csc.liv.ac.uk/~frans/KDD/Software/FPgrowth/fpGrowth.html#introduction然后自己按照要求下载他的几个java文件即可。AssocRuleMining.javaFPgrowthApp.java 等其中FPgrowthApp是...
  • FP-Growth算法的介绍

    万次阅读 2015-06-28 10:31:45
    引言:在关联分析中,频繁项集的挖掘最常用到的就是Apriori算法。Apriori算法是一种先产生候...它的思路是把数据集中的事务映射到一棵FP-Tree上面,再根据这棵树找出频繁项集。FP-Tree的构建过程只需要扫描两次数据集。
  • FP-Growth算法python实现

    万次阅读 热门讨论 2015-07-03 22:51:03
    前言:关于关联分析和FP_Growth的介绍请见:什么是关联分析、FP-Growth算法的介绍。本文主要介绍用 python 语言实现 FP_Growth 算法的代码。 正文:FP_Growth项目目录有四个文件: >FP_Growth ▪ __init__.py ...
  • fpgrowth的python实现

    2012-07-26 10:04:06
    少有的fpgrowth算法的python实现。只要传入数据集,就可计算出频繁模式集。
  • FPTree 理解

    千次阅读 多人点赞 2018-10-08 10:39:33
    FP Tree算法原理总结  在Apriori算法原理总结中,我们对Apriori算法的原理做了总结。作为一个挖掘频繁项集的...为了解决这个问题,FP Tree算法(也称FP Growth算法)采用了一些技巧,无论多少数据,只需要扫描两...
  • FP增长算法(FP Growth Algorithm)

    千次阅读 2017-03-03 10:23:08
    FP增长算法
  • Panasonic FP系列编程手册 本手册收集了FP0、FP0R、FP-e 、FPE、FP-X、FP2、FP2SH及FP10SH中可使用的指令、并对存储区的使用、编程时的注意事项进行说明。
  • FP-growth算法——原理

    千次阅读 2017-10-20 23:42:04
    FP-growth算法之前我们已经可以使用Apriori算法来在一个数据集里面找出那些支持度较高的元素组合,我们来回顾一下Apriori算法的核心。 Apriori算法的核心其实就是分三步: 1.在现有组合的基础上,生成可能的...
  • FP-growth算法,fpgrowth算法详解

    万次阅读 2016-01-15 08:40:32
    FP-growth算法,fpgrowth算法详解 使用FP-growth算法来高效发现频繁项集 前言 你用过搜索引擎挥发现这样一个功能:输入一个单词或者单词的一部分,搜索引擎酒会自动补全查询词项,用户甚至实现都不知道搜索引擎...
  • FP_TREE和FP_GROWTH算法

    2017-09-12 21:38:36
     FP树构造  FP Growth算法利用了巧妙的数据结构,大大降低了Aproir挖掘算法的代价,它不需要不断地生成候选项目队列和不断得扫描整个数据库进行比对。为了达到这样的效果,它采用了一种简洁的数据结构,叫做...

空空如也

1 2 3 4 5 ... 20
收藏数 25,553
精华内容 10,221
关键字:

fp