精华内容
下载资源
问答
  • 召回率(R值)是针对我们原来的样本而言的,它表示的是样本的正例有多少被预测正确了。 假如我此时想吃香蕉,实验室每天都会安排10个水果,分别是6个香蕉,3个橘子,1个菠萝。我在看不见的情况下从中选出5个...

    准确率(P值)是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。

    召回率(R值)是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。

    假如我此时想吃香蕉,实验室每天都会安排10个水果,分别是6个香蕉,3个橘子,1个菠萝。我在看不见的情况下从中选出5个水果,选出了2个香蕉,2个橘子,1个菠萝。

    分别求出P值,R值,F值。

    1、准确率(P值):

    准确率是针对预测结果而言的,它表示的是预测为正的样本中有多少是真正的样本。这里的正样本就是我想吃的香蕉。

    在预测结果中,有2个香蕉,总个数是选的5个,那么P值计算:P=2/5

    2、召回率(R值):

    召回率是针对我们原来的样本而来的,它表示的是样本中的正例有多少被预测正确了。

    这里的正类是我想吃的香蕉,而在样本中的香蕉树是6个,召回率的召回也可以这么理解,代表了原始样本中的正类召回了多少。那么R值计算:R=2/6

    3、F值:

    我们在评价的时候,当然是希望检索结果Precision越高越好,同时Recall也越高越好,但事实上两者在某些情况下是有矛盾的。比如在极端情况下,在这个例子中,我们只搜索出了一个结果,且是香蕉,那么Precision就是100%,但是Recall为1/6就很低;而如果我们抽取10个水果,那么比如Recall是100%,但是Precision为6/10,相对来说就会比较低。

    因此P和R指标有时候会出现的矛盾的情况,这样就需要综合考虑他们,最常见的方法是F-Measure,通过计算F值来评价一个指标。特殊情况F1=2PR/(P+R)

    展开全文
  • 准确率是针对我们预测结果而言的,它表示的是预测为正的样本有多少是真正的正样本。 举个栗子 假设我此时想吃香蕉,实验室里面每天都会安排10个水果,水果种类分别是6个香蕉,3个橘子,1个菠萝。哎,但是,实验...

    在论文看到这三个指标,从网上找了找资源,记录一下。在这里记录下来,希望对大家理解有帮助。

    准确率(Precision)

             准确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。

    • 举个栗子

    假设我此时想吃香蕉,实验室里面每天都会安排10个水果,水果种类分别是6个香蕉,3个橘子,1个菠萝。哎,但是,实验室主任搞事情呀,为了提高我们吃水果的动力和趣味,告诉我们10个水果放在黑盒子中,每个人是看不到自己拿的什么,每次拿5个出来,我去抽了,抽出了2个香蕉,2个橘子,1个菠萝。

             如前面所说,准确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。在预测结果中,有2个香蕉,总个数是我拿的5个,那么P值计算如下:

    P = 2/5
    召回率(Recall)

             召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。

    • 举个栗子

    和上面的一样

             召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。我们这里的正类是我想吃的香蕉,而在样本中的香蕉个数是6个,召回率的召回也可以这么理解,代表了,原始样本中正类被召回了多少。R计算如下:

    P = 2/6
    F值

             我们在评价的时候,当然是希望检索的结果P值越高越好,同时R值也越高越好,但事实上这两者在某些情况下有矛盾的。
             比如极端情况下,在我们这个例子中,我们只搜索出了一个结果,且是香蕉,那么P值就是100%,但是R值为1/6就很低;而如果我们抽取10个水果,那么比如R值是100%,但是P值为6/10,相对来说就会比较低。
             因此P和R指标有时候会出现的矛盾的情况,这样就需要综合考虑他们,最常见的方法就是F-Measure,通过计算F值来评价一个指标!

             这里给出最常见的F计算方法,如下:

                                                          F = (2*P*R)/(P+R)

    展开全文
  • 从本科化学中,我们知道如何通过绘制数据的不同变换并检查哪个图最适合来测试React是 0 阶、1 阶还是 2 阶。 这个程序做同样的事情。 它使用不同的顺序转换数据,尝试最大化 Pearson r 平方。 它比制作和检查...
  • title: “White Wine Quality” author: “Kira” ===========...哪个化学成分影响葡萄酒的质量? 设置文件的可读性 单变量情节部分 从数据可得,该数据集有4898 条数据和13个变量。 查看 quality 的分布 3 4 5 6 ...

    哪个化学成分影响葡萄酒的质量?


    单变量情节部分

    在这里插入图片描述
    从数据可得,该数据集有4898 条数据和13个变量。


    查看 quality 的分布

    在这里插入图片描述

    从图中可得,质量分数的分布范围是3至9,大部分的质量分数居中,最多为6分。

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    fixed.acidity的分布区间大多数在6到8之间,其峰值在6.5附近,基本属于正态分布。 volatile.acidity的分布区间大多数在0.15到0.4之间,其峰值在0.25附近,基本属于正态分布。 citric.acid的分布区间大多数在0.1到0.6之间,其峰值在0.3附近,呈现正态分布,分布在0.5附近出现异常变化。 这3种酸的分布类似quality的分布,我猜想是不是这3种酸对白葡萄酒的质量有重要影响?

    在这里插入图片描述

    residual.sugar的分布区间大多数在0.5到2之间,呈正偏斜分布。

    在这里插入图片描述
    在这里插入图片描述
    chlorides的分布区间大多数在0到0.1之间,除去长尾后,基本呈正态分布。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    free.sulfur.dioxide的分布区间大多数在0到100之间,total.sulfur.dioxide的分布区间大多数在50到250之间,它们的图形都类似正态分布。
    在这里插入图片描述
    在这里插入图片描述

    density的分布区间大多数在0.99到1之间.
    在这里插入图片描述
    在这里插入图片描述

    pH的分布区间大多数在2.8到3.6之间,呈正态分布。
    在这里插入图片描述
    在这里插入图片描述

    sulphates的分布区间大多数在0.25到0.75之间,基本呈正态分布。
    在这里插入图片描述
    在这里插入图片描述

    alcohol的分布区间大多数在8到14之间,呈偏右斜分布。


    新变量 all_acid

    由于数据集里有三种酸,所以创建一个变量all_acid把它们囊括其中。

    在这里插入图片描述

    单变量分析

    数据集的结构:
    这个数据集包含4,898 种葡萄酒,及11个量化每种酒化学成分的变量。
    质量的评分:分数在 0(非常差)和 10(非常好)之间。
    其他观测结果: 1、大部分的白葡萄酒由质量中等的构成; 2、常见的白葡萄酒的酒精度数为12度,数据集里数量最多的反而是9度; 3、各变量数值分布几乎是正态分布。

    感兴趣的主要特征:
    数据集的主要特征是 alcohol 和 quality。 我到网上了解了一下,醇类、酯类和缩醛等影响白葡萄酒呈香和呈味的最终形成,数据集里的变量就 alcohol 和这几种物质关联最大,我想就此探索一下。

    其他有助调查的特征:
    fixed.acidity, volatile.acidity, citric.acid, residual.sugar 和 PH。 毕竟酸、糖和 PH 会对人类味觉产生直接影响。

    特征的分布情况:
    所有变量几乎都是正态分布。即使我调整组宽来放大了图形,基本上还是正态分布。


    二元块部分

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    从上图可得:
    相关度较高的是 residual.sugar 与 density,相关系数为0.84; free.sulfur.dioxide 和 total.sulfur.dioxide,相关系数为0.62。
    负相关度较高的是 alcohol 与 density,相关系数为-0.78 alcohol 与 total.sulfur.dioxide,alcohol 与 residual.sugar,两组的相关系数皆为-0.45。
    从物理的角度来看,也能说明上述相关性的准确性,糖类密度大,而酒精密度小。所以 residual.sugar 的数值越大,则 density 的数值就会越大;alcohol 的数值越大,则 density 的数值就会越小。


    探索 alcohol 与 quality 的关系
    在这里插入图片描述

    从这条红色的相关性线可看出,alcohol 与 quality 呈正相关关系。


    探索 fixed.acidity 与 quality 的关系
    在这里插入图片描述

    从图中可得,fixed.acidity 与 quality 的相关性并不大,呈微弱的负相关关系。


    探索 volatile.acidity 与 quality 的关系

    在这里插入图片描述

    从图中可得,volatile.acidity 与 quality 的相关性也不大,呈较弱的负相关关系。


    探索 citric.acid 与 quality 的关系
    在这里插入图片描述

    从图中可得,citric.acid 与 quality 的相关线几乎是一条直线,它们应该没有相关性。


    探索 residual.sugar 与 quality 的关系
    在这里插入图片描述

    从图中可得,residual.sugar 与 quality 的相关性不大,呈较弱的负相关关系。


    探索 pH 与 quality 的关系
    在这里插入图片描述

    从图中可得,pH 与 quality 的相关性不大,呈较弱的正相关关系。


    探索 residual.sugar 和 density 的关系
    在这里插入图片描述

    从图中可得,residual.sugar 和 density 有很强的正相关性。


    探索 alcohol 和 density 的关系
    在这里插入图片描述

    从图中可得,alcohol 和 density 有较强的负相关性。


    双变量分析

    感兴趣的特征的变化情况:
    我所感兴趣的特征主要是 alcohol 与 quality 的关系,从图中的相关线可看出它们呈很强的正相关关系。alcohol 随 quality 的增加而增加。

    其他发现:
    令我觉得意外的是,fixed.acidity 和 volatile.acidity 这两种酸居然跟 quality 成负相关,虽然程度不大。而 pH 却跟 quality 成正相关,虽然程度也不大。根据这个发现,我猜测是不是因为人体是偏酸性的,而从医学角度来说弱碱性的食物对人体有益,导致人类演化出了喜欢弱碱性食物的味觉。

    最紧密的特征对:
    residual.sugar 和 density 的关系,从图中可以容易发现,而且它们的相关系数为0.84。


    多元的情节部分


    探索 alcohol, pH, quality 的关系

    在这里插入图片描述

    从图中可得,当 alcohol > 10.5时,这三个变量才有一个稳定的关系, 即当 alcohol 一定时,pH 的数值越高, quality 的质量也越高。


    探索 alcohol, total.sulfur.dioxide, quality 的关系

    在这里插入图片描述

    从图中来看, alcohol, total.sulfur.dioxide, quality 这三者的关系并不明显,而且对 quality 的影响也不大, 估计是二氧化硫仅作为保鲜的添加剂,不会对酒的质量造成太大的影响。


    探索 alcohol, fixed.acidity, quality 的关系

    在这里插入图片描述

    从图中可得,quality 为3和9的关系比较奇怪,可能因为这两个的数据量比较少,而一般追求这些极端质量的人的品味都会比较独特,所以会造成误差。反观 quality 为4至8的,在 alcohol > 10.5的区域,当 alcohol 一定时,fixed.acidity的数值越高,quality 的质量越低。


    探索 alcohol, density, quality 的关系

    在这里插入图片描述

    从图中可得,alcohol, density, quality 还是有一定关系的,撇开 quality 为3和9的,当 alcohol 一定时,density 的数值越高,quality 的质量越高。


    多变量分析

    特征之间彼此加强的情况:
    pH、density 和 alcohol 是相互加强了彼此。

    特征之间令人惊讶的互动:
    alcohol, total.sulfur.dioxide, quality 的关系让我挺感到意外的,它们的关系验证了二氧化硫这一防腐剂并不会对酒的质量造成大的影响。

    可选:您使用数据集创建了任何模型吗?讨论你的模型的优势和局限性。
    无。


    最后的情节和总结

    Plot One

    在这里插入图片描述
    Description One
    从图中可看出,绝大部分白葡萄酒的质量都是中等的,其中 quality = 6的最多。这也说明了市场的实际需求,中等质量的是最多人需要的。


    Plot Two

    在这里插入图片描述
    Description Two
    从图中可看出,quality 和 alcohol 有着很强的正相关关系。alcohol 就是乙醇,验证了我从网上了解到的——醇类、酯类和缩醛等影响白葡萄酒呈香和呈味的最终形成。


    Plot Three

    在这里插入图片描述
    Description Three
    从图中可看出,当 alcohol > 10.5,alcohol一定时,pH 的数值越高,quality 的质量越好。市面上酒精度数少于10度的白葡萄酒很少有,所以能说它们是有稳定的正相关性。


    Reflection

    分析过程的挫折和成功:

    刚开始探索这个数据集时,仅从自己的一些常识为方向先看看酸、糖、PH值和酒精是否对质量有最大的影响。通过后来的探索以及自己网上查阅,得到些有趣的发现,比如:人类会更喜欢偏碱性的白葡萄酒。而有些看似有很大影响的化合物——二氧化硫,却不会对白葡萄酒的质量产生太大的影响。


    未来工作的深入的提议:
    1、还是得先对数据集进行深入了解,以确定自己的探索方向,以防走弯路。
    2、要充分收集数据集各类型的数据,本次这个数据集仅有11个变量,其他有影响质量的物质诸如酯类和缩醛等都没有囊括,这样分析得出的结论难免有所局限。而且质量为3和9的数据量收集得比较少。
    3、该数据集应该把白葡萄的品种和产地、酒的年份也考虑进去。
    4、对于这个数据集,还可以建立一个模型或者计算出一个公式来预测白葡萄酒的质量。

    展开全文
  • 12Cr2Mo1R(H)化学成分

    2021-02-01 21:01:24
    12Cr2Mo1R(H)化学成分 本技术条件适用于石油卡拉玛依石化分公司120万吨年加氢改质反应器、石油化工股份有限公司九江分公司150万吨年柴油加氢精制装置用钢板的生产。 2、临氢12Cr2Mo1R、12Cr2Mo1R(H)引用标准:...

    12Cr2Mo1R(H)化学成分

    本技术条件适用于中石油卡拉玛依石化分公司120万吨年加氢改质反应器、中石油化工股份有限公司九江分公司150万吨年柴油加氢精制装置用钢板的生产。
    2、临氢12Cr2Mo1R、12Cr2Mo1R(H)引用标准:GBT713-2014
    3、临氢12Cr2Mo1R、12Cr2Mo1R(H)尺寸、外形、重量及允许偏差
    3.1钢板的尺寸、外形、重量及允许偏差应符合GBT 709标准的规定。
    3.2 厚度偏差按GBT709的B类或C类执行,在合同中注明。
    3.3钢板理论重量交货,理论计重采用的厚度为钢板允许的厚度和小厚度的算术平均值。钢的密度为
    4、临氢12Cr2Mo1R、12Cr2Mo1R(H)技术要求
    4.1 临氢12Cr2Mo1R、12Cr2Mo1R(H)化学成分
    钢的化学成分应符合表1的规定(wt%)
    注:(1)熔炼分析应按每炉(罐)号取样,产品分析应按交货张取样,“”钢板厚度125mm时,C的成品分析可以到0.17%。
    (2)带“”号的元素记录分析结果,不作为验收条件,但应满足J、X系数的规定:
    X=(10P+5Sb+4Sn+As)15,式中元素以PPM含量代入,如0.01%以100ppm代入。
    J=(Si+Mn)X(P+Sn)X100,式中元素以重量百分含量代入,如0.01%以0.01代入。
    4.2 冶炼方法:采用电炉+炉外精炼、并经过真空脱气的冶炼工艺,可以进行二次电渣重熔冶炼。钢板应为本质细晶粒钢。
    4.3 交货状态:钢板以正火(允许加速冷却)+回火状态交货。
    4.4 力学性能及工艺性能应符合表2的规定。
    4.5.1 金相组织回火贝氏体含量大于90%
    4.5.2钢板中非金属夹杂物按GBT10561规定的B法进行评定,物类(A类)、氧化铝类(B类)、硅酸盐类(C类)及球状氧化物类(D类)、单颗粒球状类(Ds类)均不得大于1.5级,且应满足

    A+C2.0,B+D+Ds2.5,A+B+C+D4.0
    5 临氢12Cr2Mo1R、12Cr2Mo1R(H)回火脆化评定试验
    5.1 回火脆化评定试验组批进行检验,组批原则按同一炉(罐)号、同一厚度、同一热处理制度的钢板组成一批,每批头尾各做一组回火脆化评定试验。
    5.2 回火脆化评定试验冲击温度为-100、-80、-60、-40、-30、-18、-0、20各组成一批,分别进行小模拟焊后热处理后和小模拟焊后热处理+步冷催化SC后的系列冲击,其结果应满足

    VTr54+2.5VTr5410。
    5.3步冷回火脆化工艺曲线:
    6 临氢12Cr2Mo1R、12Cr2Mo1R(H)试验方式及检验规则
    力学性能试验按交货张进行,其试样的切取,试验项目,试验方法、试验数量、热处理状态见表3.
    表3
    样坯切取 试验项目 试验方法 试样数量 试样 模拟焊后热处理
    封头钢板

    展开全文
  • 基组是量子化学从头计算的基础,在量子化学中有着非常重要的意义。基组的概念最早脱胎于原子轨道,随着量子化学的发展,基组的概念已经大大扩展,现已不局限于原子轨道的原始概念。在量子化学计算,根据体系的不同...
  • 化学信息学,所有可能的化合物的集合称为“化学空间”。据说这个数字高达1060或更多。此外,基于某个特征的化合物投影有时也称为化学空间。 GDB数据库 GDB数据库下载地址:...
  • 建立在移动平均技术基础之上,对任意一个样品位置,以该样品为中心具有窗口大小r可变化的移动窗口内,可计算出窗口内的一组样品所确定的统计量U(r),根据统计量的最佳 U(r0)所成的图像,可以更好的反映相邻样品...
  • vmd 计算RMSD的方法:(http://www.ks.uiuc.edu/Training/Tutorials/vmd/tutorial-html/node7.html) amber计算RMSD的方法:(http://ambermd.org/tutorials/analysis/tutorial1/)
  • scalar product,也称为点积、点乘)是接受在实数R上的两个向量并返回一个实数标量的二元运算。它是欧几里得空间的标准内积。 两个向量a = [a1, a2,…, an]和b = [b1, b2,…, bn]的点积定义为: a·b=a1b1+a2b2...
  • 特征是线性代数的一个重要概念。在数学,物理学,化学,计算机等领域有着广泛的应用。设A是n阶方阵,如果存在数m和非零n维列向量x,使得Ax=mx成立,则称m是A的一个特征或本征。非零n维列向量x称为矩阵A的...
  • 基于主成分分析和聚类探索化学空间 PCA :Principal Component Analysis 分析化合物数据库,发现它们之间的共享描述符(物理化学特性)。 1. 导入库 import os import pandas as pd import numpy as np import ...
  • 北祁连东段西、南华山酸性侵入岩以花岗岩和花岗闪长岩为主, SiO2质量分数在66.23%~ 77.13%之间,具有钙碱系列的岩石组合特征和地球化学特征。微量元素Pb、S r和La明显富集, Cs、 Nb、T i等元素呈现不同程度亏损,...
  • 两种海藻采自山东青岛太平角及汇泉角,在研究其化学组成的过程发现,抽提物饱和烃馏份的生物标志化合物面貌具有成熟原油的特征,它们的成熟度参数c29甾20s/(20S+20R达0.51,细菌生源的藿烷类化合物m/z191的...
  • R语言——中文分词包jiebaR

    万次阅读 多人点赞 2017-12-18 20:38:42
    R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的...
  • 认真读题,勾画出有效信息,其中包括:题所给的“标签”、“图表”等,必须将题所有你认为有用信息勾画出来;.认真读题,我们要求什么,我们已知条件是什么,我们还需要什么,计算公式是什么?三.经典例题1. ...
  • 函数的模型求解(正向建模)可以通过仅母体降解情况下的解析解决方案,如果仅在模型使用简单的一阶(SFO)或SFORB动力学的基于特征的解决方案执行,也可以使用数值执行deSolve软件包的求解器(默
  • Chainer Chemistry是一个使用Chainer的化学和生物学深度学习库。 Github地址:https://github.com/pfnet-research/chainer-chemistry 手册地址:https://chainer-chemistry.readthedocs.io 该库可帮助您轻松地将...
  • 物理化学笔记(1) 量子化学基础

    千次阅读 2020-04-01 18:09:49
    物理化学笔记(1)量子化学基础 化学是人类关于原子和分子的知识和智慧的结晶。一个优秀的化学家需要适当了解其他科学分支的观测角度,在一定程度上听得懂其他学者的语言。但更重要和根本的是化学家一定要能流利地...
  • 基团数不等 X n ‾ = 1 + r 1 + r − 2 r p \overline{X_n}=\frac{1+r}{1+r-2rp} Xn​​=1+r−2rp1+r​ 基团数相等 这里的基团数比要改变为: r = N a N b + 2 N b ′ r=\frac{N_a}{N_b+2N_b'} r=Nb​+2Nb′​Na​...
  • 当固定溅射总气压,加大溅射气体N2的比例时,R值 随N2比例的增加先增大,当N2的比例大于10%后,R值几乎不再随N2比例的增加而变化。XPS的结果表明, 所有试样的Ν与Ti的原子比均大于1;改变溅射气体N2的比例可明显改变N...
  • R语言中文分词包jiebaR

    千次阅读 2016-07-21 19:15:52
    R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的...
  • 统计分析表明,含水层水力参数的排放速率(Q),水力传导率(K)和透射率(T)与比容(Q / Sw)呈强正相关,R值分别为0.8462、0.8738和0.8332。 K和T分别在0.02-0.90 m / day和0.36-13.47 m2 / day之间,平均值分别...
  • 荧光在观测期间或样品存放期间、甚至暴露于室内光线时都会衰减,导致难以获得恒定或定量数据;另外从细胞和其他分子里产生的自发荧光(在许多活体天然存在的某些特定化合物产生的荧光)也会对实验结果产生干扰。 ...
  • 数据清洗异常(离群值)的判别和处理方法

    万次阅读 多人点赞 2020-07-03 20:25:01
    异常甄别可能有很多方法,实际使用的时候感觉还是箱型图好用,一目了然,清晰易懂。
  • R分类

    2016-05-31 16:17:37
    text(x1,x2,G,adj=-0.5) #显示G的在x1,x2坐标系 用一条直线来划分学习集 MASS包与线性判别函数lda( ) library(MASS) ld=lda(G~x1+x2) ld 分类判断 z=predict(ld) newG=z$class newG y=cbind(G,z$x,newG) y 距离...
  • 徐优俊,裴剑锋北京大学前沿交叉学科研究院定量生物学中心,北京 100871摘要:深度学习在计算机视觉、语音识别和自然语言处理三大领域取得了巨大的成功,带动了人工智能...
  • 以某城市城区主要功能区表层土壤 0~10,cm As、C d、C r、C u、H g、N i、P b、Z n 8种化学元素在采样点处的 含量和背景为基础,利用插值方法,给出主要观测区域内 8种主要化学元素的空间分布;并通过单因素方差...
  • 那些取代矩阵基本上将氨基酸编码为数值阵列,其中这些来自参考比对(PAM和BLOSUM矩阵)的统计分析,或来自氨基酸的物理和化学性质。虽然这些矩阵已经用于折叠识别问题,但它们还没有针对这样的任务进行优化。已经...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 7,490
精华内容 2,996
关键字:

化学中的r值