精华内容
下载资源
问答
  • 针对传统采样方式准确率与鲁棒性不够...最后利用SVM分类器进行实验验证结果表明:在6类不平衡数据集中,应用新型过采样SVM算法,相比已有采样方式,少(多)数类样本的分类准确率均有明显提高,且算法具有更强鲁棒性.
  • 然后 根据样本密度信息选择最具有代表性均衡多数类样本点, 在减少多数类样本的同时使分类界面向多数类方向偏 移. 实验结果表明, 所提出算法与其他不均衡数据预处理方法相比, 能有效提高SVM算法在失衡数据...
  • 区别于通常确保随机性随机化方法,针对具有相关特性数组随机化,提出了一种能有效保留原有相关特性的随机化方法.这一方法基于某个大样本按特定方式寻找所需随机数序列,不需传统随机化方法中已知分布及种子数...
  • 本研究目的是验证希腊语中OCI-R并在希腊非临床样本中检查其心理测量特性。 371名大学生参加了这项研究。 所使用测量指标包括OCI-R,帕多瓦问卷(PI),强迫症问卷-44(OBQ-44)和抑郁焦虑压力量表(DASS-21)...
  • 这项研究目的是评估在希腊人群非临床样本中DASS-21心理测量特性。 抑郁焦虑量表21(DASS-21)是一种自我报告工具,可测量焦虑,抑郁和压力。 验证是对12868名18至65岁希腊成年人进行。 结果表明,DASS21...
  • 提出以Voronoi镶嵌作为分析宇宙大尺度结构工具,并以此讨论了星系类似...通过比较模拟样本与星系团实际样本的异同,表明二者具有极其相似分布特性。论证了利用Voronoi镶嵌研究宇宙大尺度结构合理性与优越性。
  • 跨尺度非局部注意和穷举自样本挖掘图像超分辨率 该存储库适用于以下论文中介绍CSNLN ,,,,,和,“影像超分辨率与跨尺度非本地关注和详尽自我模范矿业”,CVPR2020, 该代码基于构建,并在带有Titan / Xp...
  • 为了增加具有射频硬件特性的射频机器学习数据集,发送和接收射频波形信号样本的MATLAB脚本。 需要使用Mathworks“来自通信USRP支持”工具箱来控制某些Ettus USRP SDR。 如何使用这些脚本 要创建适当结构RF波形...
  • 另外, 数据的分布往往都有内在结构,现有的基于度量的小样本学习算法在分类时没有考虑数据分布的特性, 阻碍了算法的效果。 本文使用基于图正则的关系传播框架, 通过结合样本分布的流形和已知的样本间关系,推断...
  • 根据光伏发电各环节影响因素解耦特性,将常规单层神经网络拆分为双层网络,使每层网络具有简化结构;用单步预测代替多步预测,降低神经网络输入输出维数;基于统计分析,将天气影响因素有效整合到预测模型中,...
  • 针对煤层自然发火标志气体中烷烃气体吸收光谱交叠严重、定量分析时需要大量样本进行标定问题,对甲烷、乙烷、丙烷、异丁烷、正丁烷5种气体吸收光谱谱图进行研究,分析了谱线与气体浓度非线性特性,得出吸收光谱部分...
  • 聚类技术可以用于对具有动态、随机和异步并发特性的出租车对象进行分类。但是,现有聚类技术认为每个出租车样本对聚类贡献相同,没有考虑到不同样本的不同影响,这在一定程度上影响了聚类精度。提出了一种基于...
  • 本文为具有横截面相关性和相关样本结构高维数据的样本协方差矩阵尖峰经验特征值建立了渐近特性。 已建立理论结果一个新发现是,在某些情况下,尖峰经验特征值将反映相关样本结构而不是横截面结构,这表明...
  • 如何检验数据样本的正态性?

    万次阅读 多人点赞 2018-09-18 00:15:36
    具有正态分布的特性,就称该组观测值具有正态性。 检验方法: 1、图示法 1.1 PP图 P-P图是根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图,用于直观地考察样本数据是否服从某一概率分布。如果...

    正态分布是自然界中最常见的也是一种最重要的分布。因此,人们在使用统计分析方法时,总是乐于正态假定,但该假定是否成立,就需要进行正态性检验了。

    定义:

    指如果一组观测值来自正态总体.具有正态分布的特性,就称该组观测值具有正态性。

    检验方法:

    1、图示法

    1.1 PP图

    P-P图是根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图,用于直观地考察样本数据是否服从某一概率分布。如果样本数据服从所假定的分布,则散点较好地落在原点出发的45°线附近。

    1.2 QQ图

    Q-Q图的结果与P-P图相似,只是P-P图是用概率分布的累计比进行正态性考察,而Q-Q图是用概率分布的分位数进行正态性考察,同P-P图一样,如果样本数据对应的总体分布确为正态分布,则在Q-Q图中,样本数据对应的散点应基本落在原点出发的45°线附近。

    1.3 直方图

    判断频率密度直方图的密度曲线是否服从正态分布的密度曲线。密度曲线是否呈中间高、两边低、左右基本对称的“钟形”曲线

    1.4 茎叶图

    茎叶图的用途同直方图,它不仅具备与直方图相同的直观性,同时能精细表达样本数据的取值水平,当样本量小时,可以通过茎叶图进行正态性呈现

    2、统计指示法

    2.1 偏度和峰度

    可参考https://blog.csdn.net/xbmatrix/article/details/69360167了解这两个统计量

    正态分布的偏度系数为0,峰度系数为3,利用正态分布的这两个特性可以检验样本数据是否来自正态分布的总体。

    2.2 偏度峰度联合检验法(Jarque-Bera)

    参考https://baike.baidu.com/item/Jarque-Bera%E6%A3%80%E9%AA%8C/8821978

    构造的统计指标为

    JB=n6(b2s+14(bk-3)2)。

    如果样本数据所来自的总体服从正态分布,,则JB近似服从自由度为2的卡方分布。

    Jarque-Bera检验相比于其他检验方法更容易成功地接受正态性假定,即Ⅰ类错误风险较低

    2.3 Shaprio-Wilk检验(W检验)

    建立检验假设H0:样本数据所来自的总体服从正态分布,

    (

     

    2.4 Kolmogorov-Smirnov检验(K-S检验)

    参考资料https://www.cnblogs.com/arkenstone/p/5496761.html

    2.5 Cramér-VonMises检验

    正态检验统计量

     

    2.6 Anderson-Darling检验

    正态检验统计量

    软件实现方法

    参考文献:

    1、数值变量正态性检验常用方法的对比

    2、偏度(skewness)和峰度(kurtosis)

     

    展开全文
  • 心理健康是各种健康结果重要预测指标。 这项研究旨在测试心理... 研究结果表明,英语和泰语版PWB-S对泰国和新加坡样本具有良好心理计量特性。 未来研究可能会使用PWB-S英语和泰语版本来评估年轻人心理健康。
  • 具有改善样本设计方差减少效果——特别是改善与通过样本的变换交互效应相关联方差减少。 该方法详细描述于: Shields, MD 和 Zhang, J。“拉丁超立方体采样概括”。 可靠性工程和系统安全。 (审查中)...
  • 一、概念 ... 它具有以下特性: 可以在相同条件下重复进行; 事先知道所有可能出现结果; 进行试验前并不知道哪个试验结果会发生. 1.2、样本空间 1.3、随机事件 二、事件相互关系和运算 ...

    一、概念

    1.1、随机试验

      对随机现象的观察、记录、实验统称为随机试验. 它具有以下特性:

    • 可以在相同条件下重复进行;
    • 事先知道所有可能出现的结果;
    • 进行试验前并不知道哪个试验结果会发生.

    1.2、样本空间

    在这里插入图片描述

    1.3、随机事件

    在这里插入图片描述
    在这里插入图片描述

    二、事件的相互关系和运算

    2.1、 事件的关系(包含、相等)

    在这里插入图片描述

    2.2、事件的运算及关系

    在这里插入图片描述
    在这里插入图片描述

    2.3、事件的运算定律

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

    展开全文
  • 结合光子晶体缺陷模式和表面模式特性,提出了一种含吸收介质光子晶体法布里-珀罗异质结构。该结构由周期性光子晶体、待测样本和外部空气层...研究结果对实现待测物高Q值和高灵敏度检测具有一定理论参考价值。
  • 1:除了具有特征门控SignalBus特性外,在将Signal树转换为有向无环图时,有时会很有用。 在找到。 板条箱 dasp是板条箱模块化集合,允许用户选择其项目所需精确工具集。 此存储库中包含以下板条箱: 图书馆...
  •  尽管这些应用类别处理信号具有不同带宽,且相应使用不同转换器架构,但比较候选ADC(模数转换器)及评估具体实施性能时,这些应用具有某些共同特性。具体而言,从事这些不同应用类别设计师需要考虑许多常见...
  • 生成对抗样本研究笔记

    千次阅读 2019-09-14 15:45:32
    对抗样本(adversarial examples)概念当初是goodfellow为了证明神经网络由于在高维特征空间中具有线性特性,容易在高维特征空间中被误导这一现象而提出来[1]。对抗样本的定义比较简单,是指给输入样本细微...

    1 引言

    对抗样本(adversarial examples)的概念当初是goodfellow为了证明神经网络由于在高维特征空间中具有线性特性,容易在高维特征空间中被误导这一现象而提出来的[1]。对抗样本的定义比较简单,是指给输入样本细微的扰动,最终导致神经网络输出非预期的效果。当然这种细微的扰动是在于人类能够辨识出来目标物体的前提下的,最好这种扰动是对人类来讲无感的。目前主要的应用于两方面:一方面用于对抗某些非法分子利用AI技术进行恶意攻击,比如12306网站的验证码识别上,在不影响人类判断的前提下能够误导AI技术自动识别;另一方面就是通过生成对抗样本来生成更具有鲁棒性的模型。

    2 分类

    2.1 黑盒与白盒

    生成对抗样本在不同的角度有不同的划分方法,如果按照被攻击的模型的话,可分为白盒与黑盒。白盒是指被攻击的模型是已知的,包括网络结构及权值参数等信息;相反黑盒就是被攻击的模型是未知的。显然,白盒的成功率会比黑盒的高。所以现在有一些黑盒是通过在某种已知的模型进行白盒生成抵抗样本,然后将生成的对抗样本送入黑盒系统中对其进行攻击。

    2.2 有目标对抗和无目标对抗

    顾名思义,有目标对抗指的是通过对输入样本进行一定的扰动,使得模型预测出所指定的类别。无目标对抗指的是对输入样本进行一定的扰动,使得模型错误的预测出自身的类别。简单点说,有目标对抗表示输入对抗样本后,模型输出是指定的目标类别,此目标类别和真实的类别不同;无目标对抗表示输入对抗样本后,模型输出不是真实的类别。从定义来看有目标对抗会比无目标更苛刻,但是比较多的文章都是针对于有目标对抗的,对于这一点我自认为是有目标对抗的损失函数比较好确定,也更容易收敛,一般也不会等到收敛,当达到目标后迭代就停止了。

    2.3 对抗生成方式

    2.3.1 基于梯度优化损失函数

    统称为FGSM家族,分别有FGSM、I-FGSM、MI-FGSM、DI2-FGSM、M-DI2-FGSM这些成员,家谱图[2]如下:
    在这里插入图片描述
    最后提一篇白盒对抗样本迁移至黑盒系统的论文NRDM(Neural Representation Distortion Method)。

    2.3.2 基于优化目标函数

    基于优化目标函数领域也有很多经典的算法,比如L-BFGS 、Deepfool、C&W(Carlini & Wagner)、Zeroth-Order Optimization(黑盒)、Curls & Whey: Boosting Black-Box Adversarial Attacksation Distortion Method等。

    2.3.3 基于几何

    这个有点剑走偏锋,之前的方法都是在神经网络的高维空间进行攻击。而此方法是通过像素之间的关系进行变换来达到误导模型的目的

    2.3.4 基于gan

    有Perceptual-Sensitive GAN for Generating Adversarial Patches、Natural Gan两篇论文,由于没读过,不多介绍。

    2.3.5 基于决策访问次数

    此方法无需特定模型,只需要不断访问目标模型的输出值即可攻击,通常为黑盒攻击,而且也符合现实世界条件。只需不断的与黑盒模型交互反馈结果来达到最优值,无需模型别的信息。咋一看很美好,但是此模型比较依赖访问次数,对于有访问限制的黑盒来讲,这种方法不太现实。

    对此没有过多的涉猎,故贴几篇论文结束:Boundary Attack、Boundary Attack++、Efficient Decision-based Black-box Adversarial Attacks on Face Recognition。

    2.3.6 其他

    除以上的方法以外,还有一些比较有意思的研究,比如对于所有的输入样本设计出一种通用的扰动来达到误导模型的目的,比如Universal adversarial perturbations方法;还有仅仅只改变图像中一个像素值来达到误导模型的目的,比如One pixel attack for fooling deep neural networks,初此之外,还有很多需要等待后来人发掘了。。。

    3 对抗源码

    Github有不少前辈们开源的对抗代码,各种算法都能找到。大都是参考了以下三种开源库:cleverhans(google)、advBox(百度)和foolbox。

    3.1 cleverhans

    里面主要有的主流攻击算法如下图所示:
    在这里插入图片描述

    3.2 advBox

    算是自家的开源库,里面大部份文档都有中文翻译,支持的攻击算法有:
    在这里插入图片描述

    3.3 foolbox

    这个还没来得及了解,这是其文档

    4 补充

    有一些我没列出来的参考文献基本很容易在搜索引擎里搜到,直接输入方法名就有相对应的论文。
    自己整理了一些代码放在github上,其中有基于M-DI2-FGSM的无目标攻击和使用cleverhans的实例(以CW为例),也有以上相关论文的参考引用~ 最后再啰嗦一句,以上是自己的总结,如有疑问或bug,欢迎大家指出,共勉!

    5. 参考文献

    [1] https://arxiv.org/pdf/1412.6572.pdf
    [2] https://arxiv.org/pdf/1803.06978.pdf

    展开全文
  • 物质太赫兹光谱具有独特“指纹谱”特性,可以利用该特性对物质进行识别。随着人工智能技术发展,深度学习算法在太赫兹光谱识别领域得到了越来越广泛应用。然而在实际应用中,受实验设备、实验条件以及实验环境...
  • 通过给定数据标注信息学习到该数据分布下内在特性,该方法能够work内在原理是同一个label下所有(准确说是大多数)数据具有相似特征分布。 无监督学习 在Contrastive learning中,多数为无监督情况,...

    有监督学习

    给定数据
    xi,i=0,1,2,nxx_i,i=0,1,2,n_x
    yi,i=0,1,2,nyy_i,i=0,1,2,n_y,即nxn_x个属于类别xx的样本,nyn_y个属于类别yy的样本
    通过给定的数据标注信息学习到该数据分布下的内在特性,该方法能够work的内在原理是同一个label下所有(准确说是大多数的)数据具有相似的特征分布。

    无监督学习

    在Contrastive learning中,多数为无监督的情况,这时候我们的数据集没有了标签。
    在这样的数据集下学习一个网络能够将x的特征聚集在x附近,将y的特征聚集在y附近。没有了label该怎么实现呢?

    答案是通过数据增强 t(.)t(.) 创建label.

    t1(x1),t2(x1)t_1(x_1),t_2(x_1) 均是由 x1x_1 扩展来的,那么他们肯定是同一个类别,而剩下都是不同的类别。

    这里便有了一个问题, x1x_1x2x_2 等凡是 xix_i 均应该分在同一个类别之内,不应该把他们统统归类为负样本。

    这里便涉及到了统计学的问题,只要我负样本足够多,那么在负样本中有几个正样本影响是比较小的,统计上将他们均归类到负样本是一个可取的方法,所以Contrastive learning方法对负样本数量的要求也是蛮大的,因为之后负样本越多,被当成负样本处理的正样本占比越小,学习到额网络性能也就越高。

    这就解释了为什么诸如MOCOSIMCLR及其进阶版都在努力增加负样本

    可以说是,通过对数据集的augmentation,拉大样本与其他样本之间的距离,减少样本自身变化之间的距离,学习该数据分布下的内在特征。
    该方法能够work的内在原理是实际应当归属于同一类的数据具有着潜在的相似特征分布。
    在这里插入图片描述
    上图近似的模拟contrastive learning的训练过程,红色代表同一个类别,蓝色代表其他类别,圆圈和方块分别是不同的数据扩展方法。

    整个网络训练要做的就是拉大两个圆之间的距离,同时减少左面圆的半径。

    但是同一个类别的数据具有着潜在相近分布,所以在不断地训练过程中,负样本中的正样本会渐渐的向分隔线靠近,其他真正的负样本会继续远离,最终的结果便是相同类别的数据聚集在一起。

    这里是引用
    如何评价Deepmind自监督新作BYOL? - 江山如画的回答 - 知乎
    https://www.zhihu.com/question/402452508/answer/1352959115

    感谢知乎大佬的解释,豁然开朗

    无监督对比学习之MOCO 《Momentum Contrast for Unsupervised Visual Representation Learning》

    无监督对比学习之力大砖飞的SimCLR《A Simple Framework for Contrastive Learning of Visual Representations》

    展开全文
  • 具有代表性铁矿石技术样本是从埃及东部南阿斯旺铁矿开采。 主要脉石含量为SiO2 7.76%和P2O5 1.13%。 铁和磷分别以赤铁矿和磷灰石形式存在78%。 将矿石在1000℃下烧制3小时。 在接近代表高炉不同区域...
  • 针对目前在噪音环境下语音识别系统性能较差问题,利用小波神经网络融合了小波变换良好时频局域化性质和RBF神经网络具有最佳分类能力和辨识能力等特性。构建了一个用小波基替代RBF网络中激活函数小波-RBF神经...
  • 在传感特性分析中,其谐振波长漂移量与生物样本折射率变化成近似线性关系,且将内部空气孔作为传感区域时灵敏度要明显高于将全芯片和耦合空气孔作为传感区域灵敏度,可达950 nm/RIU。该结构优化方法对...
  • 为了控制城市交通拥堵,优化城市公交网络,选取了截止2017年6月宝鸡市区406个站点、51条公交线路的样本数据。采用复杂网络方法构建了宝鸡市公交网络模型,分析了宝鸡市公交网络度分布、聚类系数、平均路径长度和...
  • 基于机械导纳测试山核桃树动态特性实验与分析,高旗,杜小强,本文开展了具有八年树龄矮化山核桃树在不同生长时期下动力学响应实验。根据样本树型结构划分传递路径,基于加速度导纳测试
  • 西门子SINAMICS G110产品样本pdf,西门子SINAMICS G110产品样本:SINAMICS G110变频器是一种具有基本功能,适用于多种工业变速驱动装置变频器。SINAMICS G110变频器结构特别紧凑,由单相电源供电(200V-240V),...
  • 针对传统基于单个流统计特性的网络流量分类算法识别率低、分类算法复杂问题,在分析各类应用协议...实验结果表明,该组特征用于分类还具有较好泛化特性,只需较少量训练样本即可在较长时间内保持较高识别率。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 649
精华内容 259
关键字:

样本具有的特性