精华内容
下载资源
问答
  • 带搅拌装置的管式反应器流动特性实验模型研究,赵秋月,张廷安,设计了一种带有机械搅拌装置的新型管式反应器。用NaCl溶液做示踪剂,通过L3(3)正交实验考察了流体在不同搅拌转速、不同流量及出口处
  • 建立CaO固硫反应的未...模型计算结果与实验结果分析表明,未反应收缩芯模型可较好地描述CaO-SO2固硫反应的宏观动力学,其中影响CaO固硫反应的最主要因素是化学反应扩散控制,提高CaO固硫效率最有效的方法是减小CaO粒径.
  • 一、瀑布模型 1.1什么是瀑布模型 1.2特点 1.3优缺点 1.4客户需求 二、快速原型模型 2.1什么是快速原型模型 2.2优缺点 2.3快速原型模型的思想产生、原理及运用方式 2.4类型 2.5开发步骤 三、增量模型 3.1...

    目录

    一、瀑布模型

    1.1什么是瀑布模型

    1.2特点

    1.3优缺点

    1.4客户需求

    二、快速原型模型

    2.1什么是快速原型模型

    2.2优缺点

    2.3快速原型模型的思想产生、原理及运用方式

    2.4类型

    2.5开发步骤

    三、增量模型

    3.1什么是增量模型

    3.2特点

    3.3优缺点

    3.4作用

    四、螺旋模型

    4.1什么是螺旋模型

    4.2特点

    4.3优缺点

    4.4限制条件


    一、瀑布模型

    1.1什么是瀑布模型

    1970年温斯顿.罗伊斯提出了著名的“瀑布模型”,直到80年代早期,它一直是唯一被广泛采用的软件开发模型

    瀑布模型将软件生命周期划分为制定计划、需求分析、软件设计、程序编写、软件测试运行维护等六个基本活动,并且规定了它们自上而下、相互衔接的固定次序,如同瀑布流水,逐级下落

    瀑布模型是最早出现的软件开发模型,在软件工程中占有重要的地位,它提供了软件开发的基本框架。其过程是从上一项活动接收该项活动的工作对象作为输入,利用这一输入实施该项活动应完成的内容给出该项活动的工作成果,并作为输出传给下一项活动

    从本质来讲,它是一个软件开发架构,开发过程是通过一系列阶段顺序展开的,从系统需求分析开始直到产品发布和维护,每个阶段都会产生循环反馈,因此,如果有信息未被覆盖或者发现了问题,那么最好 “返回”上一个阶段并进行适当的修改,开发进程从一个阶段“流动”到下一个阶段,这也是瀑布开发名称的由来

    对于经常变化的项目而言,瀑布模型毫无价值

    1.2特点

    1、阶段间具有顺序性和依赖性

    该阶段具有两重含义

    1. 必须等前一阶段的工作完成后,才能开始后一阶段的工作
    2. 前一阶段的输出文档就是后一阶段的输入文档,因此只有前一阶段的输出文档正确,后一阶段的工作才能获得正确的结果

    2、推迟实现的观点

    对于规模较大的软件项目来说,往往编码开始的越早,最终完成开发所需时间越长。因为前面阶段的工作没做或做的不扎实,过早地考虑进行程序实现,往往导致大量返工,有时甚至发生无法弥补的问题

    瀑布模型在编码之前设置了系统分析与系统设计的各个阶段,分析与设计阶段的基本任务规定,在这两个阶段主要考虑目标系统的逻辑模型,不涉及软件的物理实现

    清楚的区分逻辑设计与物理设计,尽可能推迟程序的物理实现,是按照瀑布模型开发软件的一条重要的指导思想

    3、质量保证的观点

    为了保证所开发的软件的质量,在瀑布模型的每一个阶段都应坚持两个重要做法

    1. 每个阶段都必须完成规定的文档,没有交出合格的文档就是没有完成该阶段的任务
    2. 每个阶段结束前都要对所完成的文档进行评审,以便尽早发现问题,改正错误

    传统的瀑布模型过于理想化,实际的瀑布模型是带"反馈环"的。如图所示(图中实线箭头表示开发过程,虚线箭头表示维护过程),当在后面阶段发现前面阶段的错误时,需要沿图中左侧的反馈线返回前面的阶段,修正前面阶段的产品后再回来继续完成后面阶段的任务

    瀑布模型是文档驱动的模型,遵守这个约束可使软件维护变得比较容易一些,从而显著降低软件预算

    1.3优缺点

    优点:

    • 项目提供了按阶段划分的检查点
    • 当前一阶段完成后,您只需要去关注后续阶段
    • 可在迭代模型中应用瀑布模型

    缺点:

    • 不适合需求模糊或需求经常变动的系统
    • 由于开销的逐步升级问题,它不希望存在早期阶段的反馈
    • 在一个系统完成以前,它无法预测一个新系统引入一个机构的影响
    • 用户可能需要较长等待时间来获得一个可供使用的系统,也许会给用户的信任程度带来影响和打击
    • 最终产品往往反映用户的初始需求而不是最终需求

    1.4客户需求

    对项目而言,是否使用这一模型主要取决于是否能理解客户的需求以及在项目的进程中这些需求的变化程度;对于经常变化的项目而言,瀑布模型毫无价值,可以考虑其他的架构来进行项目管理,比如螺旋模型

    瀑布模型强调文档的作用,并要求每个阶段都要仔细验证。但是,这种模型的线性过程太理想化,已不再适合现代的软件开发模式,几乎被业界抛弃,其主要问题在于:

    1. 各个阶段的划分完全固定,阶段之间产生大量的文档,极大地增加了工作量
    2. 由于开发模型是线性的,用户只有等到整个过程的末期才能见到开发成果,从而增加了开发的风险
    3. 早期的错误可能要等到开发后期的测试阶段才能发现,进而带来严重的后果

    按照瀑布模型的阶段划分,软件测试可以分为单元测试集成测试系统测试

     

    二、快速原型模型

    2.1什么是快速原型模型

    快速原型是快速建立起来的可以在计算机上运行的程序,它所能完成的功能往往是最终产品能完成的功能的一个子集

    快速原型模型是增量模型的另一种形式,在开发真实系统之前,迅速建造一个可以运行的软件原型 ,以便理解和澄清问题,在该原型的基础上,逐渐完成整个系统的开发工作

    它允许在需求分析阶段对软件的需求进行初步而非完全的分析和定义,快速设计开发出软件系统的原型,该原型向用户展示待开发软件的全部或部分功能和性能;用户对该原型进行测试评定,给出具体改进意见以丰富细化软件需求;开发人员据此对软件进行修改完善,直至用户满意认可之后,进行软件的完整实现及测试、维护

    2.2优缺点

    优点

    • 克服瀑布模型的缺点,减少由于软件需求不明确带来的开发风险
    • 适合预先不能确切定义需求的软件系统的开发

    缺点

    • 所选用的开发技术和工具不一定符合主流的发展;快速建立起来的系统结构加上连续的修改可能会导致产品质量低下
    • 使用前提是要有一个展示性的产品原型,一定程度上可能会限制开发人员的创新

    2.3快速原型模型的思想产生、原理及运用方式

    1、思想产生

    在需求分析阶段得到完全、一致、准确、合理的需求说明十分困难

    获得一组基本需求说明后,就快速地使其“实现”,通过原型反馈,加深对系统的理解满足用户基本要求,使用户在试用后对需求说明进行补充和精确化,从而获得合理完整、现实可行的需求说明

    再把快速原型思想用到软件开发的其他阶段,向软件开发的全过程扩展

    先用相对少的成本,较短的周期开发一个简单的、但可以运行的系统原型向用户演示或让用户试用,以便及早澄清并检验一些主要设计策略,在此基础上再开发实际的软件系统

    2、原理

    利用原型辅助软件开发

    经过简单快速分析快速实现一个原型,用户与开发者在试用原型过程中加强通信与反馈,通过反复评价和改进原型,减少误解,弥补漏洞,最终提高软件质量

    3、运用方式

    由于运用原型的目的和方式不同,在使用原型时也采取不同的策略

    • 抛弃策略:将原型用于开发过程的某个阶段,促使该阶段的开发结果更加完整、准确、一致、可靠,该阶段结束后,原型随之作废。探索型和实验型就是采用此策略的
    • 附加策略:将原型用于开发的全过程,原型由最基本的核心开始,逐步增加新的功能和新的需求,反复修改反复扩充,最后发展为用户满意的最终系统,演化型快速原型就是采用此策略

    采用何种形式、何种策略运用快速原型主要取决于软件项目的特点、可供支持的原型开发工具和技术等,根据实际情况的特点决定

    2.4类型

    在软件开发中,原型是软件的一个早期可运行的版本,它反映最终系统的部分重要特性

    探索型

    这种原型目的是要弄清对目标系统的要求,确定所希望的特性,并探讨多种方案的可行性

    实验型

    这种原型用于大规模开发和实现之前,考核方案是否合适,规格说明是否可靠

    进化型

    这种原型的目的不在于改进规格说明,而是将系统建造得易于变化,在改进原型的过程中,逐步将原型进化成最终系统

    2.5开发步骤

    1、快速分析

    在分析人员与用户密切配合下,迅速确定系统的基本需求,根据原型需要体现的特征描述基本需求以满足开发原型的需要

    2、构造原型

    在快速分析的基础上,根据基本需求说明尽快实现一个可行的系统

    要求具有强有力的软件工具的支持,并忽略最终系统在某些细节上的要求,主要考虑原型系统能够充分反映所要评价的特性

    3、运行原型

    发现问题,消除误解,开发者与用户充分协调

    4、评价原型

    在运行的基础上,考核评价原型的特性,分析运行效果是否满足用户的愿望,纠正过去交互中的误解与分析中的错误,增添新的要求,并满足因环境变化或用户的新想法引起的系统要求变动,提出全面的修改意见

    5、修改

    根据评价原型的活动结果进行修改

    若原型未满足需求说明的要求,说明对需求说明存在不一致的理解或实现方案不够合理,根据明确的要求迅速修改原型

    快速原型模型不带反馈环,软件产品的开发基本上是线性顺序进行的

    快速原型的本质是"快速"。开发人员应尽可能地建造出原型系统,以加速软件开发过程,节约软件开发成本

    原型的用途是获知用户的真正需求,一旦需求确定了,原型将被抛弃

     

    三、增量模型

    3.1什么是增量模型

    增量模型也称渐增模型。使用增量模型开发软件时,把软件产品作为一系列的增量构件来设计、编码、集成和测试。每个构件由多个相互作用的模块构成,并且能够完成特定的功能

    使用增量模型时,第一个增量构件往往实现软件的基本需求,提供最核心的功能

    把软件产品分解成增量构件时,唯一必须遵守的约束条件是,当把新构件集成到现有构件中时,所形成的产品必须是可测试的

    瀑布模型或快速原型模型目标是一次就把一个满足所有需求的产品提交给用户

    增量模型把整个软件产品分解成许多个增量构件,分批地逐步向用户提交产品

    3.2特点

    把瀑布模型的顺序特征与快速原型法的迭代特征相结合

    将软件看作一系列相互联系的增量,在开发过程的各次迭代中,每次完成其中的一个增量

    风险更大的增量模型

    确定用户需求后就着手拟定第一个构件的规格说明文档,完成后规格说明组转向第二个构件的规格说明文档,同时设计组开始涉及第一个构件

    使用该方法将不同的构件并行构建,可能加快工程进度,但将冒构建无法集成到一起的风险

    3.3优缺点

    优点

    1. 能在较短的时间内向用户提交可完成部分工作的产品
    2. 将待开发的软件系统模块化,可以分批次地提交软件产品,使用户可以及时了解软件项目的进展
    3. 以组件为单位进行开发降低了软件开发的风险。一个开发周期内的错误不会影响到整个软件系统
    4. 开发顺序灵活。开发人员可以对组件的实现顺序进行优先级排序,先完成需求稳定的核心组件。当组件的优先级发生变化时,还能及时地对实现顺序进行调整

    缺点

    1. 由于各个构件是逐渐并入已有的软件体系结构中的,所以加入构件必须不破坏已构造好的系统部分,这需要软件具备开放式的体系结构
    2. 在开发过程中,需求的变化是不可避免的。增量模型的灵活性可以使其适应这种变化的能力大大优于瀑布模型和快速原型模型,但也很容易退化为边做边改模型,从而是软件过程的控制失去整体性
    3. 如果增量包之间存在相交的情况且未很好处理,则必须做全盘系统分析,这种模型将功能细化后分别开发的方法较适应于需求经常改变的软件开发过程

    3.4作用

    1、开发初期的需求定义只是用来确定软件的基本结构,使得开发初期用户只需要对软件需求进行大概的描述;而对于需求的细节性描述,则可以延迟到增量构件开发时进行,以增量构件为单位逐个地进行需求补充。这种方式能够有效适应用户需求的变更

    2、软件系统可以按照增量构件的功能安排开发的优先顺序,并逐个实现和交付使用。不仅有利于用户尽早用上系统,能够更好地适应新的软件环境,而且在以增量方式使用系统的过程中,还能获得对软件系统后续构件的需求经验

    3、软件系统是逐渐扩展的,因此开发者可以通过对诸多构件的开发,逐步积累开发经验。实际上,增量式开发还有利于技术复用,前面构件中设计的算法、采用的技术策略、编写的源码等,都可以应用到后面将要创建的增量构件中去

    4、增量式开发有利于从总体上降低软件项目的技术风险。个别的构件或许不能使用,但一般不会影响到整个系统的正常工作

    5、实际上,在采用增量模型时,具有最高优先权的核心增量构件将会被最先交付,而随着后续构件不断被集成进系统,这个核心构件将会受到最多次数的测试。这意味着软件系统最重要的心脏部分将具有最高的可靠性,这将使得整个软件系统更具健壮性

     

    四、螺旋模型

    4.1什么是螺旋模型

    螺旋模型是一种演化软件开发过程模型,它兼顾了快速原型的迭代特征以及瀑布模型的系统化与严格监控。螺旋模型最大的特点在于引入了其他模型不具备的风险分析,使软件在无法排除重大风险时有机会停止,以减小损失。同时,在每个迭代阶段构建原型是螺旋模型用以减小风险的途径

    螺旋模型是快速原型模型以进化的开发方式为中心,在每个项目阶段使用瀑布模型法。该模型的每一个周期都包括需求定义、风险分析、工程实现和评审4个阶段,由这4个阶段进行迭代。软件开发过程每迭代一次,软件开发又前进一个层次。用螺旋模型的软件过程如下

    简化的螺旋模型

    完整的数据模型

     

    图中带箭头的点划线的长度代表当前累计的开发费用,螺旋线的角度值代表开发进度,螺旋线的每个周期对应于一个开发阶段

    图中的四个象限代表了以下活动

    1. 制定计划:确定软件目标,选定实施方案,弄清项目开发的限制条件
    2. 风险分析:分析评估所选方案,考虑如何识别和消除风险
    3. 实施工程:实施软件开发和验证
    4. 客户评估:评价开发工作,提出修正建议,制定下一步计划

    4.2特点

    螺旋模型在“瀑布模型”的每一个开发阶段前引入一个非常严格的风险识别、风险分析和风险控制,它把软件项目分解成一个个小项目。每个小项目都标识一个或多个主要风险,直到所有的主要风险因素都被确定

    螺旋模型强调风险分析,使得开发人员和用户对每个演化层出现的风险有所了解,继而做出应有的反应,因此特别适用于庞大、复杂并具有高风险的系统

    4.3优缺点

    优点

    1. 对可选方案和约束条件的强调有利于已有软件的重用,也有助于把软件质量作为软件开发的一个重要目标
    2. 减少了过多测试(浪费资金)或测试不足(产品故障多)所带来的风险
    3. 在螺旋模型中维护只是模型的另一个周期,在维护和开发之间并没有本质区别

    缺点

    1. 采用螺旋模型需要具有相当丰富的风险评估经验和专门知识,在风险较大的项目开发中,如果未能够及时标识风险,势必造成重大损失
    2. 过多的迭代次数会增加开发成本,延迟提交时间

    4.4限制条件

    1. 螺旋模型强调风险分析,但要求许多客户接受和相信这种分析,并做出相关反应是不容易的,因此,这种模型往往适应于内部的大规模软件开发
    2. 如果执行风险分析将大大影响项目的利润,那么进行风险分析毫无意义,因此,螺旋模型只适合于大规模软件项目
    3. 软件开发人员应该擅长寻找可能的风险,准确地分析风险,否则将会带来更大的风险

    一个阶段首先是确定该阶段的目标,完成这些目标的选择方案及其约束条件,然后从风险角度分析方案的开发策略,努力排除各种潜在的风险,有时需要通过建造原型来完成。如果某些风险不能排除,该方案立即终止,否则启动下一个开发步骤。最后,评价该阶段的结果,并设计下一个阶段

    展开全文
  • 行业分类-物理装置-基于热重实验的单峰可燃物热解反应机理模型确定方法.zip
  • 分析了理论计算11B(p,α)2α核反应截面的重要意义。利用选择共振遂穿模型对11B(p,α)2α的核反应...理论计算和实验测量值在一定程度上符合的很好,进一步说明选择共振遂穿模型是计算有明显峰值的核反应截面的有效方法。
  • 基于对不同实验条件下反应时程特性的分析,以经典的米氏方程为理论基础,提出了同时考虑蛋白质单底物水解、蛋白酶失活以及底物或产物抑制因素的机理模型,并构建了指数形式动力学方程dh/dt=aexp(-bh),其中参数a和...
  • 理论上, 基于“S1+S0:left-right_arrow:1(TT)i :left-right_arrow: T1+T1”三状态反应模型, 采用耦合的速率方程组对所有的发光衰减曲线进行了拟合, 得到了激子裂变过程中所涉及的重要速率常数. 根据每种材料的摩尔...
  • 四妙勇安汤对实验性动脉粥样硬化模型兔氧化应激及炎症反应的干预研究,张军平,许颖智,探讨四妙勇安汤对家兔动脉粥样硬化的干预效果及作用机理。36只日本雄性大耳白兔随机分为4组,分别为正常对照组、模型组、四妙...
  • 多相光催化体系的光强分布模型建立较为复杂,特别是当液相中有机质具有一定吸光性时更为困难。...结合上述三个方面建了环状光反应模型实验验证其有较好的相关性,对多相光催化环状反应器的设计和
  • 为揭示上流式厌氧反应器(UASB)改性污泥处理含铬废水过程中硫酸根还原与化学需氧量(COD)的去除、微生物增长之间的定量关系,在合理的假设及分析下,通过理论推导建立了COD降解与硫酸根还原的动力学模型,并通过实验测得...
  • 为探索不同煤种的气化反应特性及其动力学,以神木煤、新疆准东煤和印尼加里曼丹岛煤3种煤质差异较大的低阶煤为原料,在水平管式炉上制备了3种煤样的900℃快速热解煤焦,并采用...随机孔模型能较好地拟合煤焦气化实验数据。
  • 涌入煤层的水量是煤炭地下气化过程中十分重要的影响因素,利用地下气化模型实验平台对涌水条件下的气化过程进行研究.结果表明,平均温度直接反应了煤气组分和热值的高低,煤气有效成分H2,CO,CH4和热值基本上与气化区...
  • 对热逆流反应器的陶瓷床内部流动均匀性进行了实验研究,建立了陶瓷床的流动阻力数学模型,并进行了流体力学机理分析。研究结果表明:陶瓷床整体速度分布不均匀,并且均匀性指数随着进口流速的提高而降低;上、下集气箱的...
  • 虽然Heck反应具有的区域选择性和位点选择会大大增加反应预测任务的难度(如图1),但是考虑其是一个经典的人名反应,并且对于构建碳-碳键相关反应的基础研究具有重大的意义,因此该实验围绕Heck反应预测为中心任务,...

    今天给大家介绍的是浙江工业大学智能制药研究院的段宏亮教授研究团队发表在Chemical Communications上的文章 "Heck reaction prediction using a transformer model based on a transfer learning strategy"。

     

    迁移学习是一种将某个领域或任务中学习到的基础知识或模式应用到不同但相关问题中的方法,可以有效缓解因目标任务训练样本过少造成的负面影响。由于该方法的强大应用性,因而引发了研究者对其在化学领域的应用探索。作者以经典的小数据-Heck人名反应为代表,证明了迁移学习这一方法在反应预测任务上具有强大性能,同时进一步扩展了transformer这一语言翻译模型在化学领域的应用,突破性地解决了有限数据预测的难题,为后续的人工智能辅助化学研发提供了重要的现实依据。

    图片

     

    1.研究背景

    Transformer模型是谷歌公司于2017年研发的一种语言翻译模型。与经典的神经循环网络(Recurrent Neural Network, RNN)不同,该模型完全依赖于注意力机制(attention mechanism)并且能够更好地捕捉文字序列相关信息。近年来,化学家逐渐将目光投向这一模型的实际化学应用并取得重大的突破。但是受限于化学数据的规模较小,对于小数据反应transformer模型的预测效果并不显著。该文研究者创新性地提出使用迁移学习(transfer learning)来突破这个困局,使小数据的高精度预测能够成为现实。值得注意的是,该文所使用的迁移学习,是一类经典的机器学习优化手段。该方法通过将化学领域的基础知识转移到特定的小数据预测,可以有效地提高模型对于小数据集的知识理解和性能预测。

     

    在该篇文章中,作者选择Heck反应作为代表反应用于验证transformer + 迁移学习这一实验策略方案的有效性。虽然Heck反应具有的区域选择性和位点选择会大大增加反应预测任务的难度(如图1),但是考虑其是一个经典的人名反应,并且对于构建碳-碳键相关反应的基础研究具有重大的意义,因此该实验围绕Heck反应预测为中心任务,以transformer模型和迁移学习优化手段为两大有力工具,展开小数据预测探索的研究工作。

    图片

    图1. Heck反应通式及反应机理。

     

    2.方法

    2.1 实验流程

    作者通过构建一系列的对比实验来评估transformer模型在Heck反应预测这一目标任务的表现。在该文章中,加入迁移学习的模型命名transformer-transfer learning模型,未含有迁移学习的参照模型则称为transformer-baseline模型。

    图 2. Transformer模型预测Heck反应产物的方法示意图。浅绿色背景中显示的是加入迁移学习的Heck反应预测过程,右侧白色背景中展示的是未加入迁移学习的Heck反应预测过程。
    图 2. Transformer模型预测Heck反应产物的方法示意图。浅绿色背景中显示的是加入迁移学习的Heck反应预测过程,右侧白色背景中展示的是未加入迁移学习的Heck反应预测过程。

     

    Transformer-transfer learning模型的训练步骤主要分为两步:预训练和迁移训练。第一步,transformer模型首先在含有大量基础化学反应的数据库上进行端到端的训练,从而获得基础的化学知识。第二步,transformer模型将所学的这些基础化学知识迁移到Heck反应预测的目标任务中并且在Heck反应数据集上进一步训练,从而结合基础化学知识以及Heck特有的化学信息特征。最后,模型根据预训练和迁移训练过程中学习到的知识要素做出相应的Heck反应产物的预测。而transformer-baseline模型作为对比组,仅仅在Heck反应数据集上进行训练,然后做出相应的预测。具体的步骤如图2所示。

     

    2.2 实验数据

    该实验涉及两个数据集:预训练数据集和Heck反应数据集。预训练数据集是用于学习基础的化学反应知识从而弥补目标小数据集因数据缺乏导致的基础信息过少的缺陷。该数据集来源于美国专利数据库,共包含37万个实际应用化学反应,涵盖大部分的基础化学知识。而Heck反应数据集则是该文作者自己进行数据挖掘工作创建的。研究者从Rexays商业库中下载实验数据,经过一系列的数据清洗工作,最终获得9959个符合要求的Heck反应用于验证实验的有效性。这里值得注意的是,为了避免模型直接从预训练数据中获得关于Heck反应的信息导致对于迁移学习这一策略评估混淆,该实验特地删除了预训练数据中关于Heck反应的有效信息,从而保证了评估模型性能的真实性。表1为具体的Heck反应数据集信息。

     

    表1. Heck反应数据集分布。

    图片

     

    3.研究结果

    3.1 模型表现

    Transformer-transfer learning模型无论对于分子间还是分子内Heck反应的预测都具有非常强大的预测性能:对于分子间的Heck反应预测,transformer-transfer learning模型的top-1准确率能达到95.3%,而对于数据量较少且更为复杂的分子内Heck反应预测,transformer-transfer learning模型的top-1准确率仍能达到87.7%。但是与之相比, transformer-baseline模型对于这两类反应的预测表现并不使人满意,分别只有66.7%和58.7%的准确率。表2为具体的结果分析,从这些结果中可以体现transformer + 迁移学习这一实验策略方案的强大之处。同时,研究者也指出迁移学习的确能够非常有效地增进transformer模型对于数据信息的提取。无论是化学信息还是序列之间的对应关系,transformer模型通过迁移学习能够对其有更深刻的认识。

     

    表2. Transformer-transfer learning模型和transformer-baseline模型对于分子间和分子内Heck反应预测的top-1准确率。

    图片

     

    考虑到分子间Heck反应能为工业上和医学上各种重要的取代烯烃和二烯烃的合成提供了简便途径,作者又根据反应物的类型(乙烯、单取代烯烃、二取代烯烃和三取代烯烃)来进一步展开讨论transformer对于分子间Heck反应的预测性能,并且希望通过该分析能够对于实际的合成产生现实意义的引导。

     

    表3. Transformer-transfer learning模型和transformer-baseline模型对于一取代烯烃作为反应物参与的分子间Heck反应预测的top-1准确率。

    图片

     

    如表3所示,对于以乙烯作为反应物的分子间Heck反应,transformer-transfer learning模型的top-1准确率达到97.1%,体现了该模型的高精度预测性能。虽然研究者指出一取代烯烃在发生分子间Heck反应的过程中会面临区域选择性问题,导致模型对于这一类反应的预测难度的增加,但是对于这一涉及复杂的区域选择性反应的预测,transformer-transfer learning模型仍表现其强大的预测能力。此外针对涉及到以二取代和三取代烯烃作为反应物的分子间Heck反应, transformer-transfer learning 模型仍然能取得较好的预测效果。

     

    与此同时,作者指出,含有多个卤素或双键的反应物在发生Heck反应时也会涉及到位点选择性问题。在Heck反应数据集中,共有375个Heck反应具有含多个双键的反应物。对于这一类反应,transformer-transfer learning 模型也取得了不俗的成绩,获得了85.3%的top-1准确率。而对于反应物中含有多个卤素的Heck反应,transformer-transfer learning 模型的top-1准确率能达到91.9%。

     

    图片

    图3.Transformer-transfer learning模型预测正确的Heck反应示例。A, 涉及区域选择性的反应例子:(a) β位插入,得到 (E)-1, 2-二取代烯烃;(b) α位插入以获得1, 1-二取代烯烃;(c) β位插入以获得 (Z)-1,2-二取代烯烃。B, 涉及位点选择性的反应例子:(a) 烯烃反应物中存在多个碳-碳双键;(b) 烯烃反应物中存在多种卤素。

     

    3.2 实验验证

    为了证明transformer-transfer learning模型的实际应用性,作者根据模型的预测方案进行化学实验。根据实验结果,该研究获得了两个文献中未报导的Heck反应产物。作者指出transformer + 迁移学习这一策略方案的确可以作为化合物设计的先导手段对实验合成提供有效的方向指导。

     

    图片

    图4. 化学实验得到的产物与transformer-transfer learning模型预测产物的比较。

     

    4.结论

    在这项工作中,作者将迁移学习策略与transformer模型结合,以Heck反应作为代表,进行小数据的化学反应预测。经实验证明,在引入迁移学习策略后,Heck反应预测的top-1准确率从66.3% 提高到94.9%,体现出迁移学习对于transformer模型强大的性能增强作用。同时,该研究也指出transformer + 迁移学习这一策略方案这种方式的确可以有效解决以数据为驱动的模型在小数据领域的应用困局。为了验证这一方法的现实适用性,作者通过以模型给出的候选方案进行实验合成,并且成功地获得了两个未报导的涉及区域选择性和位点选择性的Heck反应产物。通过理论和实验的结合,该研究充分显示了Transformer-transfer learning模型在现实上的应用价值。

     

    在人工智能辅助化学反应预测这一领域,化学数据的缺乏极大地阻碍了这一方向的进展,该研究创造性地提出使用迁移学习优化手段以及transformer模型来突破这一难关。我们有理由相信这一优化策略可以应用到更多的化学反应预测任务并且极大提高这类方法的实际应用能力。

    参考资料

    Ling Wang, Chengyun Zhang, Renren Bai, Jianjun Li and Hongliang Duan. Heck reaction prediction using a transformer model based on a transfer learning strategy, Chem. Commun., 2020, 56, 9368-9371.

    展开全文
  • 部署了一个非市场离散选择实验(DCE)模型,其中包含四选项属性束。 在该区域内五个病区的382名随机抽样的受访者中,每个人都获得了“现状”选择。 结果表明备选方案2; 社区管理的WQTS成为53.9%的首选。 其次,...
  • 酸压模型实验的相似准则及相似比尺研究,李小刚,杨兆中,酸压是油气藏重要的增产措施之一。实际酸压施工过程中存在,既有地层岩石破裂,又有缝壁岩石与缝内酸液的非均相化学反应,一般通
  • 为获得煤气化炉数值模拟研究中常用湍流气相反应模型的适用性和准确性,通过数值模拟分析比较了3种湍流气相反应模型计算的温度场、浓度场和碳转化率分布,并与实验数据进行比较。结果表明:湍流气相反应模型对气化炉火焰...
  • 认知模型仿真实验基于视觉目标导向的简约规则约束搜索假设,模拟了规则选择的认知过程,结果显示模拟反应时间与真实反应时间偏差0.07 s.研究结果表明,启发规则选择是一个视觉目标导向的简约规则约束搜索过程.
  • 针对煤的催化气化反应中以往的动力学模型适应这一情况,以气固非催化缩核反应动力学模型为基础,考虑了催化剂对反应的作用,并将催化剂的...结果表明,在模型适用范围内模型模拟值与实验结果吻合良好,误差在1.4%以内。
  • 本文为学习笔记,供自己复习回顾,分享,交流,如果专家们发现谬误之处欢迎批评与修正。 ---------------------------------------------------...由于时间原因,一个月没来写了,严格意义上离散选择模型和联合分析...

    本文为学习笔记,供自己复习回顾,分享,交流,如果专家们发现谬误之处欢迎批评与修正。

    ----------------------------------------------------------------------------------------------------------------------------

    由于时间原因,一个月没来写了,严格意义上离散选择模型和联合分析并不属于机器学习的范畴,但是由于课程的设置,也算是机器学习在商务分析上面的应用吧。。。。。。

     

    1. 离散选择模型

    逻辑回归(Logistic Regression)研究的是自变量对于二分类因变量的影响,但实际生活很多很多时候我们面临的都是自变量对于多分类非连续的目标(因变量)的影响。例如,人们的职业选择受父母职业,教育背景等因素影响,对于保险种类的选择也受很多因素影响。在这种状况下,简单的逻辑回归和线性回归有一定的局限性。因此离散选择模型(Discrete Choice Modelling)可以提供一个有效的建模途径,在经济学与社会学领域都有广泛的应用。

    1.1 多类别逻辑模型 —— 类别型因变量

    对于三分类的因变量,让Y=0,1,2,在三分类模型中,我们需要两个逻辑函数。

    设:有 p 个协变量 X=(x1,x2,,,,,,xp)以及一个常数。

    因此这两个逻辑函数如下,

    因此三分类的概率为:

    这样我们就可以计算三分类的概率进而进行分类。

    为了简化相对危险度(odds ratios)的估算和解释,我们将二分类的OR进行推广。

    OR 用来解释在不同条件下输出概率的比值,例如,吸烟肺癌概率是不吸烟肺癌概率的四倍,这个四倍就是相对危险度。

    所以一系列的的相对危险度公式如下,

     

    特殊情况就是协变量二分类,简化为

     

    1.1 多类别逻辑模型 ——有序型因变量

    实际问题中常常出现反应变量为有序多分类,例如疾病的严重程度,工作表现等等。

    与上面介绍的类别型多分类因变量有所不同,分对数(logits)直接参与有序当中,最常见的方式有三种:

    1.相邻类别(the adjacent category)

    2.连续比例(the continuation ratio)

    3. 组成比例 / 累积logit模型

    最常使用的是累积logit模型,该模型利用有序这一特点,得到比基线类别更有解释性的模型。

    Y 的累积概率是指Y落在一个特定点(落入类别 j 或 以下)的概率,对结果为类别 j 时,其累积概率为:

    累积概率满足:

    累积概率模型并不是利用最后一个概率,因为它必然为1.

    在有序逻辑回归中,相对风险率如下:

    最后一个类别(分数为4)不具有相对风险率,因为其为1.

    因此,

    注意:这里β前面的符号是负的,不是正的,解释如下:

    这么做可以让大的系数与更大的分数相关,当你看到对于一个二分类因素的一个正系数时,你知道大分值更可能时第一个分类,一个负系数更可能低分;对于连续变量,正系数意味着增长,更大可能高分。所以,一个高分相关,意味着在低分上的更小累积概率,也就是更少发生。

    对于不同协变量x1,x2,x2-x1=1,对于一个特定类 j ,其

    意味着,对于每单位 x 的变化,给定特定 j ,其odds=,也就是说,X变化成比例与β.

    因此,有序逻辑回归,其累积概率如下:

    2. 联合分析

    联合分析也叫权衡分析,用于评估不同属性对于消费者的相对重要性,以及不同属性水平给消费者带来的效用的统计分析方法,通过询问特定产品特征与其他产品特征,挖掘产品特征对消费者购买策略的重要性,并计算哪种特定产品特性价格组合能最大限度的吸引消费者消费。

    创建属性列表

    1.属性假设独立,并且拥有不同等级,假设互相排斥,一个产品只能拥有属性的一个等级。

    2.属性等级应该清晰明了,不能含糊,谁也不知道贵是多少钱。

    3.三到五个等级就够了,太多了不好,谁能整明白了。

    4.尽可能平衡不同属性的等级数,例如,($10, $12, $14, $16, $18, $20)就比($10, $15,
    $20)相对更重要,因为层次多。

    5.让组合可解释强,别大CPU整个1G内存,不是都人呢么。
    问问题做调查

    做调研问用户喜欢什么,什么组合什么的,之后排行,就可以得到排名了。

    联合分析的三种方法

    1.传统方法

    对产品组合使用正交队列,之后使用卡牌排序评级。价格弹性是个问题。

    2.适应性联合分析(ACA)

    自适应联合分析是一种混合联合分析方法,他用到了产品组合分析以及自报告相关性信息。

    有三个组成:

    1.偏好属性评分

    2.属性内部等级排序

    3.部分产品组合比较

    缺点也是忽略了价格弹性。

    3.基于选择的联合分析(Choice Based Conjoint)

    CBC目前成为首选方法,因为它能够真正的衡量价格弹性,而且容易解释权衡任务。

    在备选集合中全部的产品组合互相竞争。

    受访者可以在备选集合中选择其中一个或者不选,

    由于相对定价的策略,其价格弹性模型更为精准。

     

    总结

    1.离散选择常常应用于一下情景:

    设计新产品或者改进已有产品,评估最适合的产品定价,评估品牌价值

    2.在离散选择中,响应者同时考虑多个产品组合,并完成一系列选择任务,在每个任务中,响应者被要求回答那个产品他更喜欢。

    3.离散选择分析产生对相对重要性的测量

    4.偏好占有率可以被模拟进行。

     

    展开全文
  • 目的:建立大鼠背部切口疼痛模型,以条件性位置偏爱实验(CPP)观察大鼠对止痛药对乙酰氨基酚作用的主观反应。方法:在大鼠右下背部定位作手术切口并缝合后,以对乙酰氨基酚100mg/kg伴药适应4次,每次间隔12h,观察适应前后...
  • 通过对实验数据的拟合,得出两个模型参数:硅氮反应速率常数和氮气在产物层中的扩散系数.假定反应速率常数和扩散系数均满足阿伦尼乌斯公式,求得化学反应激活能和指前因子分别为2.71×104 J・mol-1和3.07×10-5m...
  • 为提高计算效率,提出了基于局部非均匀假设、适用于粗网格的拟泡-乳三相非均匀曳力(PBTD)模型,建立三维流动-传递-反应模型,预测反应器内的流场和组分浓度分布。研究结果表明:在粗网格条件下,非均匀曳力模型可以...
  • 独立于NEOS + DANSS模型的短基线νe振荡的确定,使我们能够分析反应堆速率,而无需假设主要反应堆抗中微子通量的值和具有自由检测器效率的镓源实验数据。 根据数据拟合获得对反应堆中微子通量和镓检测器效率的校正...
  • 在水浴保温的实验装置中,对煤样分别进行通入氮气、通入氧气、不通气体时升温(20~80℃)实验,用固定功率的加热棒进行加热升温,模拟煤体高温区域时的氧化。通过对升温曲线的分析和计算,并结合能量守恒方程建立模型...
  • 目的:建立符合临床特征的、稳定的“两次打击”大鼠全身炎症反应综合征(SIRS)模型。方法:实验组取30只大鼠,股动脉放血诱发休克,随后回输全部血液。血压平稳后,在腹腔注射不同剂量的内毒素(LPS,各6只),观察...
  • 应用此方法,一次升温 实验结果即可确定反应模型参数。随着球团温度升高,反应过程可以分为613 K以下挥发分的快 速析出阶段、613~973 K挥发分的缓慢析出阶段以及已裂解挥发分和固定碳的还原阶段。
  • 对于较小的动物而言,耳膜的特征是易兴奋的膜或鼓,... 特别强调提供一个易于应用的模型来描述实验和进行数值研究。 通过分析双弹簧模型在听觉研究中的适用性来补充分析处理。 附录中给出了两弹簧模型的弹性理论观点。
  • 核天文物理学中用于模拟重元素核合成的大多数理论方法都采用了所谓的统计模型,以描述原子核的激发和衰变特性。 该模型的基本假设之一是Brink-Axel假设的有效性以及... 我们提出了一种新颖的实验方法,首次可以进行实验

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 28,223
精华内容 11,289
关键字:

反应选择模型实验