精华内容
下载资源
问答
  • 20210208-开源证券-万华化学-600309-万华化学深度报告之二:美国房地产周期向上,或持续催化MDI需求增长.pdf
  • 通过化学浴和直流溅射沉积相结合的方法容易地自底向上生长金字塔形的ZnO:Al膜
  • 20210720-德邦证券-利尔化学-002258-深度报告:草铵膦景气向上,规模及成本优势奠定高成长.pdf
  • 20210720-德邦证券-利尔化学-002258.SZ-深度报告:草铵膦景气向上,规模及成本优势奠定高成长.pdf
  • 量子化学(理论化学的分支学科)语音编辑锁定讨论上传视频量子化学(quantum chemistry)是理论化学的一个分支学科,是应用量子力学的基本原理和方法研究化学问题的一门基础科学。研究范围包括稳定和不稳定分子的结构、...

    量子化学

    (理论化学的分支学科)

    语音

    编辑

    锁定

    讨论

    上传视频

    量子化学(quantum chemistry)是理论化学的一个分支学科,是应用量子力学的基本原理和方法研究化学问题的一门基础科学。研究范围包括稳定和不稳定分子的结构、性能及其结构与性能之间的关系;分子与分子之间的相互作用;分子与分子之间的相互碰撞和相互反应等问题。

    中文名

    量子化学外文名

    quantum chemistry

    释    义

    理论化学的一个分支学科

    量子化学简介

    编辑

    语音

    065e2e382c0ca53483e4dd5feb7cd9a6.png量子化学是理论化学的一个分支学科,是应用量子力学的基本原理和方法,研究化学问题的一门基础科学。

    1927年海特勒和伦敦用量子力学基本原理讨论氢分子结构问题,说明了两个氢原子能够结合成一个稳定的氢分子的原因,并且利用相当近似的计算方法,算出其结合能。由此,使人们认识到可以用量子力学原理讨论分子结构问题,从而逐渐形成了量子化学这一分支学科。

    量子化学发展

    编辑

    语音

    量子化学第一个阶段

    3ba30f3c75bd22a9d051c0352216d7ba.png

    量子化学(图1)量子化学的发展历史可分两个阶段:第一个阶段是1927年到20世纪50年代末,为创建时期。其主要标志是三种化学键理论的建立和发展,分子间相互作用的量子化学研究。在三种化学键理论中,价键理论是由鲍林在海特勒和伦敦的氢分子结构工作的基础上发展而成,其图象与经典原子价理论接近,为化学家所普遍接受。

    分子轨道理论是在1928年由马利肯等首先提出,1931年休克尔提出的简单分子轨道理论,对早期处理共轭分子体系起重要作用。分子轨道理论计算较简便,又得到光电子能谱实验的支持,使它在化学键理论中占主导地位。

    配位场理论由贝特等在1929年提出,最先用于讨论过渡金属离子在晶体场中的能级分裂,后来又与分子轨道理论结合,发展成为现代的配位场理论。

    量子化学第二个阶段

    第二个阶段是20世纪60年代以后。主要标志是量子化学计算方法的研究,其中严格计算的从头算方法、半经验计算的全略微分重叠和间略微分重叠等方法的出现,扩大了量子化学的应用范围,提高了计算精度。

    1928~1930年,许莱拉斯计算氦原子,1933年詹姆斯和库利奇计算氢分子,得到了接近实验值的结果。70年代又对它们进行更精确的计算,得到了与实验值几乎完全相同的结果。计算量子化学的发展,使定量的计算扩大到原子数较多的分子,并加速了量子化学向其他学科的渗透。

    量子化学研究范围

    编辑

    语音

    b9d489ef9262ee6b297a715b7adeff0d.png

    量子化学(图2)量子化学的研究范围包括稳定和不稳定分子的结构、性能,及其结构与性能之间的关系;分子与分子之间的相互作用;分子与分子之间的相互碰撞和相互反应等问题。

    量子化学可分基础研究和应用研究两大类,基础研究主要是寻求量子化学中的自身规律,建立量子化学的多体方法和计算方法等,多体方法包括化学键理论、密度矩阵理论和传播子理论,以及多级微扰理论、群论和图论在量子化学中的应用等。应用研究是利用量子化学方法处理化学问题,用量子化学的结果解释化学现象。

    量子化学的研究结果在其他化学分支学科的直接应用,导致了量子化学对这些学科的渗透,并建立了一些边缘学科,主要有量子有机化学、量子无机化学、量子生物和药物化学、表面吸附和催化中的量子理论、分子间相互作用的量子化学理论和分子反应动力学的量子理论等。

    三种化学键理论建立较早,至今仍在不断发展、丰富和提高,它与结构化学和合成化学的发展紧密相联、互相促进。合成化学的研究提供了新型化合物的类型,丰富了化学键理论的内容;同时,化学键理论也指导和预言一些可能的新化合物的合成;结构化学的测定则是理论和实验联系的桥梁。

    其它化学许多分支学科也已使用量子化学的概念、方法和结论。例如分子轨道的概念已得到普遍应用。绝对反应速率理论和分子轨道对称守恒原理,都是量子化学应用到化学反应动力学所取得的成就。

    今后,量子化学在其他化学分支学科的研究方面将发挥更大的作用,如催化与表面化学、原子簇化学、分子动态学、生物与药物大分子化学等方面。

    量子化学计算方法

    编辑

    语音

    主要分为:①分子轨道法(简称MO法,见分子轨道理论);②价键法(简称VB法,见价键理论)。以下只介绍分子轨道法,它是原子轨道对分子的推广,即在物理模型中,假定分子中的每个电子在所有原子核和电子所产生的平均势场中运动,即每个电子可由一个单电子函数(电子的坐标的函数)来表示它的运动状态,并称这个单电子函数为分子轨道,而整个分子的运动状态则由分子所有的电子的分子轨道组成(乘积的线性组合),这就是分子轨道法名称的由来。

    量子化学HFR方程

    分子轨道法的核心是哈特里-福克-罗特汉方程 (Hartree-Fock-Roothaan),简称HFR方程,它是以三个在分子轨道法发展过程中做出卓著贡献的人的姓命名的方程。1928年D.R.哈特里提出了一个将n个电子体系中的每一个电子都看成是在由其余的n -1个电子所提供的平均势场中运动的假设。这样对于体系中的每一个电子都得到了一个单电子方程(表示这个电子运动状态的量子力学方程),称为哈特里方程。使用自洽场迭代方式求解这个方程(见自洽场分子轨道法),就可得到体系的电子结构和性质。哈特里方程未考虑由于电子自旋而需要遵守的泡利原理。1930年,B.A.福克和J.C.斯莱特分别提出了考虑泡利原理的自洽场迭代方程,称为哈特里-福克方程。它将单电子轨函数(即分子轨道)取为自旋轨函数(即电子的空间函数与自旋函数的乘积)。泡利原理要求,体系的总电子波函数要满足反对称化要求,即对于体系的任何两个粒子的坐标的交换都使总电子波函数改变正负号,而斯莱特行列式波函数正是满足反对称化要求的波函数。将哈特里-福克方程用于计算多原子分子,会遇到计算上的困难。C.C.J.罗特汉提出将分子轨道向组成分子的原子轨道(简称AO)展开,这样的分子轨道称为原子轨道的线性组合(简称LCAO)。使用LCAO-MO,原来积分微分形式的哈特里-福克方程就变为易于求解的代数方程,称为哈特里-福克-罗特汉方程,简称HFR方程。

    量子化学RHF 方程

    闭壳层体系 (Roothaan Equaton of Closed-Shell Systems) 是指体系中所有的电子均按自旋相反的方式配对充满某些壳层(壳层指一个分子能级或能量相同的即简并的两个分子能级)。这种体系的特点,是可用单斯莱特行列式表示多电子波函数(分子的状态),描述这种体系的HFR方程称为限制性的HFR方程,所谓限制性,是要求每一对自旋相反的电子具有相同的空间函数。限制性的HFR方程简称RHF方程。

    量子化学UHF 方程

    a8fdff234ece6df96bff5f231280f1d8.png

    量子化学的计算开壳层体系(Roothaan Equation of Open-Shell Systems)是指体系中有未成对的电子(即有的壳层未充满)。描述开壳层体系的波函数一般应取斯莱特行列式的线性组合,这样,计算方案就将很复杂。然而对于开壳层体系的对应极大多重度(所谓多重度,指一个分子因总自旋角动量的不同而具有几个能量相重的状态)的状态(即自旋角动量最大的状态)来说,可以保持波函数的单斯莱特行列式形式(近似方法)。描述这类体系的最常用的方法是假设自旋向上的电子(自旋)和自旋向下的电子(β自旋)所处的分子轨道不同,即不限制自旋相反的同一对电子填入相同的分子轨道。这样得到的HFR方程称为非限制性的HFR方程,简称UHF方程。

    原则上讲,有了HFR方程(不论是RHF方程或是UHF方程),就可以计算任何多原子体系的电子结构和性质真正严格的计算称之为从头计算法。RHF方程的极限能量与非相对论薛定谔方程的严格解之差称为相关能。对于某些目的,还需要考虑体系的相关能。UHF方程考虑了相关能的一小部分,更精密的作法则须取多斯莱特行列式的线性组合形式的波函数,由变分法求得这些斯莱特行列式的组合系数。这些由一个斯莱特行列式或数个斯莱特行列式按某种方式组合所描述的分子的电子结构称为组态,所以这种取多斯莱特行列式波函数的方法称为组态相互作用法(简称CI)。

    量子化学应用范围

    编辑

    语音

    量子化学材料科学

    (一)在建筑材料方面的应用

    水泥是重要的建筑材料之一。1993年,计算量子化学开始广泛地应用于许多水泥熟料矿物和水化产物体系的研究中,解决了很多实际问题。

    钙矾石相是许多水泥品种的主要水化产物相之一,它对水泥石的强度起着关键作用。程新等[1 ,2]在假设材料的力学强度决定于化学键强度的前提下,研究了几种钙矾石相力学强度的大小差异。计算发现,含Ca钙矾石、含Ba 钙矾石和含Sr 钙矾石的Al -O键级基本一致,而含Sr 钙矾石、含Ba 钙矾石中的Sr,Ba 原子键级与Sr-O,Ba -O共价键级都分别大于含Ca 钙矾石中的Ca 原子键级和Ca -O共价键级,由此认为,含Sr 、Ba 硫铝酸盐的胶凝强度高于硫铝酸钙的胶凝强度[3]。

    将量子化学理论与方法引入水泥化学领域,是一门前景广阔的研究课题,它将有助于人们直接将分子的微观结构与宏观性能联系起来,也为水泥材料的设计提供了一条新的途径[3]。

    (二) 在金属及合金材料方面的应用

    过渡金属(Fe 、Co、Ni)中氢杂质的超精细场和电子结构,通过量子化学计算表明,含有杂质石原子的磁矩要降低,这与实验结果非常一致。闵新民等[4]通过量子化学方法研究了镧系三氟化物。结果表明,在LnF3中Ln原子轨道参与成键的次序是:d>f>p>s,其结合能计算值与实验值定性趋势一致。此方法还广泛用于金属氧化物固体的电子结构及光谱的计算[5]。再比如说,NbO2是一个在810℃具有相变的物质(由金红石型变成四方体心),其高温相的NbO2的电子结构和光谱也是通过量子化学方法进行的计算和讨论,并通过计算指出它和低温NbO2及其等电子化合物VO2在性质方面存在的差异[6]。

    量子化学方法因其精确度高,计算机时少而广泛应用于材料科学中,并取得了许多有意义的结果。随着量子化学方法的不断完善,同时由于电子计算机的飞速发展和普及,量子化学在材料科学中的应用范围将不断得到拓展,将为材料科学的发展提供一条非常有意义的途径[5]。

    量子化学能源研究

    (一)在煤裂解的反应机理和动力学性质方面的应用

    煤是重要的能源之一。近年来随着量子化学理论的发展和量子化学计算方法以及计算技术的进步,量子化学方法对于深入探索煤的结构和反应性之间的关系成为可能。

    量子化学计算在研究煤的模型分子裂解反应机理和预测反应方向方面有许多成功的例子, 如低级芳香烃作为碳/ 碳复合材料碳前驱体热解机理方面的研究已经取得了比较明确的研究结果。由化学知识对所研究的低级芳香烃设想可能的自由基裂解路径,由Guassian 98 程序中的半经验方法UAM1 、在UHF/ 3-21G*水平的从头计算方法和考虑了电子相关效应的密度泛函UB3L YP/ 3-21G*方法对设计路径的热力学和动力学进行了计算。由理论计算方法所得到的主反应路径、热力学变量和表观活化能等结果与实验数据对比有较好的一致性,对煤热解的量子化学基础的研究有重要意义。

    (二)在锂离子电池研究中的应用

    锂离子二次电池因为具有电容量大、工作电压高、循环寿命长、安全可靠、无记忆效应、重量轻等优点,被人们称之为“最有前途的化学电源”,被广泛应用于便携式电器等小型设备,并已开始向电动汽车、军用潜水艇、飞机、航空等领域发展。

    锂离子电池又称摇椅型电池,电池的工作过程实际上是Li + 离子在正负两电极之间来回嵌入和脱嵌的过程。因此,深入锂的嵌入-脱嵌机理对进一步改善锂离子电池的性能至关重要。Ago 等[8] 用半经验分子轨道法以C32 H14作为模型碳结构研究了锂原子在碳层间的插入反应。认为锂最有可能掺杂在碳环中心的上方位置。Ago 等[9 ] 用abinitio 分子轨道法对掺锂的芳香族碳化合物的研究表明,随着锂含量的增加,锂的离子性减少,预示在较高的掺锂状态下有可能存在一种Li - C 和具有共价性的Li - Li 的混合物。Satoru 等[10] 用分子轨道计算法,对低结晶度的炭素材料的掺锂反应进行了研究,研究表明,锂优先插入到石墨层间反应,然后掺杂在石墨层中不同部位里[11]。

    随着人们对材料晶体结构的进一步认识和计算机水平的更高发展,相信量子化学原理在锂离子电池中的应用领域会更广泛、更深入、更具指导性。

    量子化学化学计算

    生物大分子体系的量子化学计算一直是一个具有挑战性的研究领域,尤其是生物大分子体系的理论研究具有重要意义。由于量子化学可以在分子、电子水平上对体系进行精细的理论研究,是其它理论研究方法所难以替代的。因此要深入理解有关酶的催化作用、基因的复制与突变、药物与受体之间的识别与结合过程及作用方式等,都很有必要运用量子化学的方法对这些生物大分子体系进行研究。毫无疑问,这种研究可以帮助人们有目的地调控酶的催化作用,甚至可以有目的地修饰酶的结构、设计并合成人工酶;可以揭示遗传与变异的奥秘, 进而调控基因的复制与突变,使之造福于人类;可以根据药物与受体的结合过程和作用特点设计高效低毒的新药等等,可见运用量子化学的手段来研究生命现象是十分有意义的。

    量子化学量子化学大家

    编辑

    语音

    唐敖庆

    中国量子化学之父,1940年毕业于西南联合大学,1955年当选中国科学院院士,东北人民大学(现吉林大学)教授,吉林大学校长,在中国乃至世界化学界具有崇高地位。

    词条图册

    更多图册

    展开全文
  • 化学方程式

    2017-11-29 04:00:57
    5) 对于其他的一些特殊情况,如可逆化学方程式(事实上大部分的化学变化是可逆过程)用双向箭头表示,有些产生气体的分子后面需要用向上的箭头表示,在产生过程上还有可以加一些外界物理条件,产生沉淀需要说明等,...
  • 物理化学笔记(1) 量子化学基础

    千次阅读 2020-04-01 18:09:49
    物理化学笔记(1)量子化学基础 化学是人类关于原子和分子的知识和智慧的结晶。一个优秀的化学家需要适当了解其他科学分支的观测角度,在一定程度上听得懂其他学者的语言。但更重要和根本的是化学家一定要能流利地...

    物理化学笔记(1)量子化学基础

    化学是人类关于原子和分子的知识和智慧的结晶。一个优秀的化学家需要适当了解其他科学分支的观测角度,在一定程度上听得懂其他学者的语言。但更重要和根本的是化学家一定要能流利地使用分子语言。

    脱离了量子化学的物理化学将变成完全宏观唯象的,二十世纪初的物理化学。如果学习完物理化学而不懂得联系宏观与原子分子,那样的物理化学无疑是一个遗憾

    一、 薛定谔方程

    1. 薛定谔方程基本表达

    到目前为止,对单个原子、离子、分子的图像,最好的描述方法是量子力学。而对于这些具有波粒二象性的微观粒子,通过解薛定谔方程获取粒子波函数之后,微观体系的状态和该状态所决定的各种物理性质可用此波函数来表示,我们就可以得到体系内粒子的全部信息——这对于多粒子体系也是如此。对一维体系,薛定谔方程的形式如(1)式,而其三维空间的形式可以方便地利用梯度概念扩展,即(2)式:
    iΨt=22m2Ψx2+VΨ i\hbar\frac{\partial \Psi}{\partial t} = \frac{\hbar^2}{2m}\frac{\partial^2 \Psi}{\partial x^2} + V\Psi

    iΨt=22m2Ψ+VΨ i\hbar\frac{\partial \Psi}{\partial t} = \frac{\hbar^2}{2m} \nabla^2{\Psi} + V\Psi

    上式的Ψ(x,t)\Psi(x,t)即为微观粒子体系的时空函数——波函数,它最关键的物理意义由Born的统计诠释指出,即Ψ(x,t)2|\Psi(x,t)|^2表示在t时刻在x处此粒子出现的概率密度,用公式表达为:
    VΨ(x,y,z,t)2dxdydz={在t时刻发现粒子在某体积元处的概率} \int_V |\Psi(x,y,z,t)|^2dxdydz = \left\{\text{在t时刻发现粒子在某体积元处的概率}\right\}
    上式的三维坐标在简化到一维坐标时表达完全相同的本质。这样的统计诠释赋予波函数以现实意义,也使它必须具有单值、有限、连续、归一化的条件,哪怕是随时间演化时也是如此。

    2. 由波函数导出力学性质

    量子力学体系是一套完备的数学物理体系,其中有一些我们需要知道的结论:

    1. 宏观体系的力学量是微观量子体系的对应量的统计平均值(严格意义上说,是对含有相同体系的系综的重复测量平均),也即“期望值”,这些微观体系的力学量的统计平均遵循经典力学的基本定律。

    2. 宏观系统中统计”期望“的表达如下,其中ρ(x)\rho(x)为概率密度函数,从某种意义上来说可以代表系统的粒子分配函数(在总体足够大时的统计分配):
      <x>=xρ(x)dx \left<x\right> = \int{x\rho(x)}dx

      <f(x)>=f(x)ρ(x)dx \left<f(x)\right> = \int{f(x)\rho(x)dx}

      这种统计期望必然满足:(注意:没有写出积分区间的积分号默认为全空间)
      ρ(x)dx=1 \int_{-\infty}^{\infty}\rho(x)dx = 1

      <σ2>=(x<x>)2ρ(x)dx=<x2><x>2 \left< \sigma^2\right> = \int\left({x-\left<x\right>}\right)^2\rho(x)dx = \left<x^2\right>-\left<x\right>^2

      (7)式即为此统计形式的方差计算方法,这种方差在统计热力学中用来表示实际量相对于统计平均的”涨落“,而在量子力学中可以表示物理量的不确定度。在量子力学中,概率密度函数为Ψ(x,t)2|\Psi(x,t)|^2,从而坐标量的期望值可以表达为:
      <x>=xΨ(x,t)2dx \left<x\right> = \int x|\Psi(x,t)|^2dx
      波函数一般都是复数形式,其模的计算满足Ψ(x,t)2=ΨΨ|\Psi(x,t)|^2 = \Psi\Psi^*,从而坐标的期望值表达为:
      <x>=ΨxΨdx \left<x\right> = \int \Psi x\Psi^*dx

    3. 由于力学量期望值遵循经典力学定律,可以导出动量的期望值的表达:
      <p>=md<x>dt=i(ΨΨx)dx=Ψ(ix)Ψdx \left<p\right> = m\frac{d\left<x\right>}{dt}=-i\hbar\int\left(\Psi^* \frac{\partial \Psi}{\partial x} \right)dx = \int \Psi^*\left(-i\hbar\frac{\partial}{\partial x}\right)\Psi dx
      由此,引入动量算符p^=i\hat p = -i\hbar\nabla(一维的表达即如式10)和坐标算符x^\hat x(高维完全一样),由于经典力学中所有的力学量均表示为坐标和动量的函数,记为Q(x,p)Q(x,p),则每一个力学量对应一个算符Q^(x^,p^)\hat Q(\hat x,\hat p),其期望值的求解只需要用p^=i\hat p = -i\hbar\nabla来取代Q(x,p)Q(x,p)中的每一个pp,然后将得到的算符放在Ψ\Psi^*Ψ\Psi之间,再在空间中积分:
      <Q(x,p)>=ΨQ^(x^,p^)Ψdx \left<Q(x,p)\right> = \int \Psi^*\hat Q(\hat x, \hat p)\Psi dx
      例如,动能的期望值为:
      <T>=22mΨ2Ψx2dx \left<T\right> = -\frac{\hbar^2}{2m}\int\Psi^*\frac{\partial^2 \Psi}{\partial x^2}dx
      对应于动能的算符为
      T^=22m2 \hat T =-\frac{\hbar^2}{2m}\nabla^2

    4. 薛定谔方程中的势函数V(x,t)V(x,t)也可以用算符来表达,一般就用V^\hat V表示

    5. 一旦波函数确定,整个体系的各个力学量期待值也就确定了,并且这些力学量期望值遵循经典力学定律,所有期望值均可由坐标和动量唯一确定——这也是对应性原理(Corresponding Principle)的必然要求。量子与计算化学的任务说到底就是发展各式各样的方法来求解薛定谔方程并得到体系的性质。

    3.不确定性原理

    对于任何波动现象,其波动的周期性越好,波长定义就越清晰,但波的具体位置就越不清晰,反之,如果波的具体位置越清晰,波动的周期性就越差,波长的定义就越不清晰,这一点可以从傅里叶(Fourier)分析中的一个定理严格证明,在定性的讨论中,综合波粒二象性粒子的德布罗意(de Broglie)关系:
    p=hλ=2πλ p = \frac{h}{\lambda} = \frac{2\pi\hbar}{\lambda}
    这样,波长的弥散就对应了动量的弥散,从而,对一个全同体系(系综)的测量不会产生同样的结果,粒子的位置定的越精确,动量就越不精确。通过量子力学的方法可以严格证明:
    σxσp2 \sigma_x \sigma_p \ge \frac{\hbar}{2}
    这就是著名的海森堡不确定性原理(Heisenberg’s Uncertainty Principle),这也是微观粒子最重要的特征之一,即某些两两成对的性质,比如位置和动量、时间和能量、都不能同时确定。这不是仪器精准度的问题,而是波粒二象性的必然。

    需要注意的是,一切物质都具有波粒二象性,从而不确定性原理对宏观和微观的一切物质均成立,只是位置和动量的弥散在宏观尺度上可以忽略不计。一切问题都有其本征精确度,如果我们一味追求精确而不做任何近似,那样的做法是愚蠢的。

    4. 化学体系中的薛定谔方程

    化学体系中,势函数V(x,t)V(x,t)由粒子间的作用形成,一般来说是不依赖时间的,在这种情况下通过分离变量法得到的薛定谔方程即为定态(time-independent)薛定谔方程:
    22m2ψ+Vψ=Eψ -\frac{\hbar^2}{2m}\nabla^2\psi+V\psi = E\psi
    或者表示为哈密顿算符的模式,式中E直接表达体系能量:
    H^ψ=Eψ \hat{H}\psi = E\psi
    ψ(x)\psi(x)即为粒子的定态波函数,关于这个“定态”的意义以及之后延伸出来的一系列量子模型将在后续讨论。需要指出的是,所谓“算符”就是一直用运算符号,它作用于一个函数,对这个函数施行算符所包含的数学运算。在量子力学中,每个厄米算符对于一个物理量,算符作用于其本征函数可以读出其对应物理量的本征值。后续的讨论中我们会发现,算符可以看做是波函数张成的Hilbert空间的子空间中的一个变换(一个变换是从自身集合到自身集合的映射)。

    二、定态与定态波函数

    我们已经给出了定态薛定谔方程,即式(17),接下来来讨论定态的性质。定态薛定谔方程是由非含时势函数结合分离变量法(这是物理学家解任何偏微分方程的首选)来将时间和坐标分开从而求解的,这个定态有以下特点

    1. 它们是定态(stationary states),尽管波函数本身:

      Ψ(x,t)=ψ(x)eiEt/ \Psi(x,t) = \psi(x)e^{-iEt/\hbar}
      是与时间有关的,但是概率密度
      Ψ(x,t)2=ΨΨ=ψe+iEt/ψeiEt/=ψψ=ψ(x)2 |\Psi(x,t)|^2 = \Psi\Psi^* = \psi^*e^{+iEt/\hbar}\psi e^{-iEt/\hbar} = \psi^*\psi = |\psi(x)|^2
      中的时间因子相互抵消,它就不依赖时间了。这一点可以推广到计算任何动力学变量的期望值,即(11)式变为:
      <Q(x,p)>=ψQ^(x^,p^)ψdx \left<Q(x,p)\right> = \int\psi^*\hat Q(\hat x,\hat p)\psi dx
      推广到三维空间即:
      <Q(x,y,z,p)>=VψQ^(x^,y^,z^,p^)ψdv \left<Q(x,y,z,p)\right> = \int_V\psi^*\hat Q(\hat x,\hat y,\hat z,\hat p)\psi dv
      任何一个力学期望值都是不依赖时间的,从而在很大程度上我们可以完全去掉时间因子φ(t)=eiEt/\varphi(t) = e^{-iEt/\hbar},用定态波函数ψ\psi代替波函数Ψ\Psi,容易证明这个ψ\psi也满足单值有限连续归一化的条件。但一定要明确真正的波函数是含时的。此后,我们提到的”波函数“一般均指定态波函数。

      顺带一提,在定态中,<x>\left<x\right>必定为一常数,因此一定有<p>=0\left<p\right> = 0

    2. 它们是具有确定总能量的态。(这点可以理解:定态的总能量确定而其时间是难以确定的),在严密的经典力学(哈密顿力学)中,总能量(动能加势能)称为哈密顿(Hamitonian)
      H(x,p)=p22m+V(x) H(x,p) = \frac{p^2}{2m}+V(x)
      对应的哈密顿算符也符合之前提到的替换规则:
      H^=h22m2+V(x) \hat H = -\frac{h^2}{2m}\nabla^2 + V(x)
      从而定态薛定谔方程可以由式(16)写成式(17)的形式。容易用上面的公式得出σH2=0\sigma_H^2 = 0,也即对相同定态构成的系综的不同测量会得到相同的能量值,不存在弥散。

      稍微一提,区分于牛顿力学的,严密的哈密顿力学以能量等作用量为基础,而力只是能量的负梯度,也即一阶Taylor展开系数。这里已经有了能量“是相互作用的标度”的概念,我们在统计热力学部分会进一步提及。

    3. 这样的定态中,一般解是分离变量解的线性叠加。含时薛定谔方程具有这样的性质:多个解函数Ψ(x,y,z,t)\Psi(x,y,z,t)的线性叠加仍然是它的解(这点将在后续展开)。定态薛定谔方程(式17)给出一个无限的解集。一旦得到分离解,便可以立刻构造一个一般解,其形式为:
      Ψ(x,y,z,t)=Σn=1cnψn(x,y,z)eiEt/ \Psi(x,y,z,t) = \Sigma_{n=1}^{\infty}c_n\psi_n(x,y,z)e^{-iEt/\hbar}

    4. 对于定态薛定谔方程的每一个归一化的解,其能量E必然要大于V(x)V(x)的最小值。否则,定态波函数将不可归一化,也就没有了意义。

    三、波函数与希尔伯特空间

    1. 定态波函数的正交归一性和完备性

    在第二节中我们给出了定态薛定谔方程的形式及其所解得的定态波函数的一些特点。在实际求解具体体系的定态波函数并得到能量表达之前,让我们先来考察一下定态波函数的两个更有趣的性质,这两个性质在量子力学框架下业已严格证明:

    1. 相同体系解出来的定态波函数是相互正交归一的。我们可以用狄克罗内克符号δ\delta来描述这个性质,这个特殊符号的定义如式(25)所示:
    δmn=def{0 n1m = n \delta_{mn} \overset{\text{def}}{=} \begin{cases} 0&\text{m $\neq$ n} \\ 1&\text{m = n} \end{cases}
    从而定态波函数的正交归一性表示如下:
    ψm(x)ψn(x)dx=δmn \int\psi_m(x)^*\psi_n(x)dx = \delta_{mn}

    2.相同体系解出来的波函数是完备的:也就是说任意一个函数f(x)f(x)都可以用这些定态波函数的线性叠加来表示,即:
    xR,f(x)=Σn=1cnψn(x) \forall x \in R, f(x) = \overset{\infty}{\underset{n=1}{\Sigma}} c_n\psi_n(x)
    式(27)实际上就是函数f(x)f(x)的Fourier展开式,傅里叶展开的原理告诉我们,任何一个函数均可以用一套周期内两两正交且完备的三角函数基底的级数展开式表达,这个基底为{cos(nx),sin(nx)nN}\{cos(nx),sin(nx)|n\in N\},其展开式为:
    f(x)=a0+Σn=1(ancos(nx)+bnsin(nx)) f(x) = a_0 + \overset{\infty}{\underset{n=1}{\Sigma}}\left(a_ncos(nx)+bnsin(nx)\right)
    此展开式表达f(x)f(x)的程度由狄利克雷(Dirichlet)定理可以说明:如果:f(x)f(x)在单个周期内除了有限个点外有意义并且单值,且f(x)f(x)f(x)f'(x)在单个周期内分段光滑,那么在x的连续点上,Fourier展开式收敛于f(x)f(x),而在x的间断点,Fourier展开式收敛于其左右极限的均值,即(f(x+0)+f(x0)2\frac{(f(x+0)+f(x-0)}{2}。利用基底正交的性质可以求得a0,an,bna_0,a_n,b_n,具体过程可以参照任意一本高等数学教材

    回过头来看,定态波函数会具有这种级数展开的性质一点都不奇怪。根据欧拉公式eix=cos(x)+isin(x)e^{ix} = cos(x) + isin(x),波函数无论是用三角函数形式表达还是用复指数形式表达,它们的本质应当是一致的。值得一提的是,基于Fourier展开的Fourier Transformation在量子力学,尤其是波动力学中,具有非常重要的应用,此处不再展开。

    2.Hilbert空间:量子力学中的线性代数

    从线性代数的角度来看,定态薛定谔方程,即式(17),和线性代数中的特征方程是一样的形式:
    A^x=λx \hat Ax = \lambda x
    如果细心观察,你会发现矩阵乘法其实就是一种线性变换,这种变换作用于特征向量(eigenvector),即可以得到其特征值(eigenvalue),而在式(17)中,力学量算符(即哈密顿算符)作用于其本征函数(eigenfunction),可以得到对应的力学量的本征值(eigenvalue),即能量。本征值和本征函数是国内结构化学与量子化学教材中常见的翻译,这里给出了英文原文,可以看出定态薛定谔方程和特征方程完全就是一回事。

    事实上,对于一切算符,若将一个算符作用在一个函数ff上,满足:
    G^f=Gf \hat Gf = Gf
    则称ff是算符G^\hat G的本征函数,G为G^\hat G的本征值。式(30)即是本征值方程。在量子力学中,所有力学量(能量,角动量等)均可用坐标和动量表达,它们对应的算符就是将坐标和动量的算符代入即可得到,对此波函数所表达的微观体系的状态,该力学量的测量所得到的结果就是对应力学量算符的本征值。

    线性空间的严格定义可以参照任何一本高等代数教材,在广泛的线性空间之中,空间的基本元素——向量,不再局限于几何中的向量形式,而是在给定集合和数域内满足可加性和数乘比例性的任意抽象向量元。其中最经典的元素就是函数。自然科学中的函数实际上是数域到数域的映射,而只要选定一组基底,所有的函数均可以表示成这组基的线性表出的形式。显然,无论是Taylor展开还是Fourier展开,其本质都是选定一组基去线性表出所有的函数。

    我们已经说明了给定体系波函数的正交归一性和完备性,这自然表明了波函数满足抽象向量的定义条件,与此同时,在量子力学框架内,力学量对应的算符作为线性变换作用于“向量”之上,因此,量子力学的自然语言是线性代数。

    量子力学的“向量”是波函数,它们存在于无穷维线性空间中,除了类似于有限维线性空间(即欧几里得空间)的约束条件以外,为了表示可能的物理状态,波函数ψ\psi必须是归一化的,因此这个空间实质上是所有在特定区域内平方可积函数的集合:
    f(x),f(x)2dx< \forall f(x), \int|f(x)|^2dx < \infty
    所构成的无限维线性空间。物理学家把这样的矢量空间即称作希尔伯特(Hilbert)空间,因此,在量子力学中,(含时)波函数是处于Hilbert空间之中,或者说,特定量子体系的所有解波函数张成一个Hilbert空间。需要指出的是,在严格的数学领域中,这个"Hilbert空间"只是严格意义上的希尔伯特空间的子空间。相应的,力学量算符则是Hilbert空间内的线性变换。

    3.态叠加原理,内积和厄米算符

    1. 内积和函数正交,归一,完备性

    我们定义两个函数f(x)f(x)g(x)g(x)的内积如下:
    <fg>=f(x)g(x)dx \left<f|g\right> = \int f(x)^*g(x)dx
    如果f(x)f(x)g(x)g(x)都是平方可积的,即两者都在Hilbert空间之中,则它们的内积一定存在。我们可以从定义出发得到内积的两个基本性质:
    <gf>=<fg> \left<g|f\right> = \left<f|g\right>^*

    <ff>=f(x)2dx=C(CR,C0) \left<f|f\right> = \int|f(x)|^2dx = C (C \in R, C \ge 0)

    我们之前已经说明过函数的正交归一性和完备性的性质,此处用内积形式再次说明:

    如果一个函数与自身的内积为1,我们称之为归一化的;如果两个函数的内积为0,那么这两个函数是正交的。如果一组函数既是归一的也是相互正交的,称它们为正交归一的。即:
    <fmfn>=δmn \left<f_m|f_n\right> = \delta_{mn}
    以及,在Hilbert空间中,如果存在一组函数,其它任意函数都可以表示为这组函数的线性叠加,那么这组函数是完备的,即:
    f(x)=Σn=1cnfn(x) f(x) =\overset{\infty}{\underset{n=1}{\Sigma}}c_nf_n(x)
    且如果函数是正交归一的,上式中的常数可以用Fourier展开的方法得到,用内积表示为:
    cn=<fnf> c_n =\left<f_n|f\right>
    在(四)中我们会发现,一维无限深方势井的定态在*(0,a)*区间构成了一个完备正交归一系,而谐振子的定态则在(,+)(-\infty,+\infty)区间构成了一个完备正交归一系。

    2. 态叠加原理

    Hilbert空间中,所有可观测量算符的本征波函数是完备的,其相应的本征态所张成的线性空间也一定是完备的。即,对于Hilbert空间中的任意一个量子客体ψ\psi,我们都可以把它写成所有本征函数的线性组合。
    ψ=ΣnCiψi \psi = {\Sigma}_n{C_i\psi_i}
    这就是所谓的态叠加原理。将它翻译为易于理解的语言便是:若ψ1,ψ2,...,ψn\psi_1,\psi2,...,\psi_n为一微观体系可能状态的波函数,则由它们线性组合所得的ψ\psi也是该体系可能存在的状态。这个cnc_n可以说明"Ψ\Psiψn\psi_n的权重",且对这些本征波函数而言,cn2|c_n|^2是对一整套体系测量得到EnE_n的概率。

    这种态叠加原理是分子轨道(MO)理论中轨道叠加组合的基础。

    3.厄米算符与本征函数

    一个力学可观测量Q(x,p)Q(x,p)的期望值可以用内积符号简洁地表示出来:
    <Q>=ψQ^ψdx=<ψQ^ψ> \left<Q\right> = \int \psi^*\hat Q\psi dx = \left<\psi|\hat Q \psi \right>
    一次测量的结果应当是实数,否则没有意义。这样一来多次测量的平均值也应是如此(注意,多次测量应当是对系综而言)
    <Q>=<Q> \left<Q\right> = \left<Q^*\right>
    但由内积的性质,内积的复共轭会颠倒次序,因此:
    <ψQ^ψ>=<Q^ψψ> \left<\psi|\hat Q \psi \right> = \left<\hat Q \psi | \psi \right>
    Hilbert空间中的任意波函数都满足式(41),因此表示可观测量的算符有非常特殊的意义。我们给出如下定义:若算符Q^\hat Q满足:
    <fQ^f>=<Q^ff> \left<f|\hat Q f \right> = \left<\hat Qf|f \right>
    我们称这样的算符为厄米(hermitian)算符。即:可观测量由厄米算符表示,在《结构化学基础》上,它又被称作自轭算符。

    厄米算符的定义表明它可以作用于内积的左侧项和右侧项且结果都一样。由于厄米算符的期望值是实数,它们自然出现在量子力学之中。且,由于力学量对应的算符在Hilbert空间内是线性变换,从而厄米算符也是线性的。

    对于厄米算符的讨论存在离散谱和连续谱两种情况,我们需要掌握的是:

    1. 厄米算符表示一切可观测量算符

    2. 在离散谱中,厄米算符对可归一化的本征函数,其本征值必然是实数,并且属于不同本征值的本征函数相互正交。在连续谱中,内积可能不存在,需要另外讨论。

    3. 进一步推广到连续谱,有如下公理:厄米算符(可观测量算符)的本征函数是完备的,在Hilbert空间中,任何函数都可以用它们的线性叠加来表达

    4. **广义统计诠释:**如果测量一个处于Ψ(x.t)\Psi(x.t)态的粒子的可观测量Q(x,p)Q(x,p),那么其结果一定是厄米算符Q^(x^,p^)\hat Q(\hat x, \hat p)的一个本征值。

      广义统计诠释将Born的只描述位形空间的波函数的统计意义扩展到了全部可观测力学量,即可观测力学量对应的本征函数的概率同样是该力学量空间下波函数模的平方,同时各个力学量空间的关系由傅里叶变换保证。而傅里叶变换的目的也正好是通过积分变换的形式进行空间的变换,因此数学又一次优雅的将不同物理现象统一了起来。

    5. 对于某个微观体系而言,如果描述该体系的波函数是某物理量Q(x,p)Q(x,p)的厄米算符Q^(x^,p^)\hat Q(\hat x,\hat p)的本征函数,那么物理量QQ的值即为本征值就和实验测定值相对应。若此波函数可以展开成Hilbert空间内一组波函数的线性展开
      ψ=ΣnCiψi \psi = {\Sigma}_n{C_i\psi_i}
      则物理量Q(x,p)Q(x,p)的平均值(期望值)为:
      <Q(x,p)>=Σncn2Qn \left<Q(x,p)\right> = \Sigma_n|c_n|^2Q_n
      如果描述该体系的波函数不是某物理量QQ的本征态,我们可以用之前提到过的通用方法,用积分计算这个物理量的期望值,也即式(39)。

    四、定态单,双粒子体系的处理

    之前所讨论的都是为了建立一个相对完整的,基于薛定谔方程的量子力学图像,接下来我们来具体看看薛定谔方程在特定图景下的应用。

    1. 势箱与平动能级

    1.一维无限深方势阱

    假设一个微观粒子在这样一个势场中:
    V(x)={00xaanywhere else V(x) {=} \begin{cases} 0&\text{$0 \le x \le a $} \\ \infty&\text{anywhere else} \end{cases}
    一个粒子在这样的势能中除了在两个端点以外都是自由的,在端点处有无穷大的力限制它逃逸。国内教材往往把“势阱”译作“势箱”,其本质一致。
    图1

    图1. 一维无限深方势井示意图

    在势阱外,ψ(x)=0\psi(x)=0,因为找到粒子的概率必然为零。在势井内,V=0V=0,定态薛定谔方程可以写成如下的形式:
    22md2ψdx2=Eψ -\frac{\hbar^2}{2m}\frac{d^2\psi}{dx^2} = E\psi
    或者写成:
    d2ψdx2=k2ψ, 其中 k=2mE \frac{d^2\psi}{dx^2} = -k^2\psi, \text{ 其中 } k = \frac{\sqrt{2mE}}{\hbar}
    这是一个典型的描述谐振子运动的二阶微分方程,其一般解为:
    ψ(x)=Asinkx+Bcoskx \psi(x) = Asinkx+Bcoskx
    这里的A和B属于积分常数,需要由问题的边界条件决定,这个边界条件一般来自于波函数的连续、有限、单值、归一化条件(在非端点处,归一化要求。波函数的连续性要求:
    ψ(0)=ψ(a)=0 \psi(0) =\psi(a)=0
    以使势阱内外解连续(这点其实和波尔氢原子论中的“定态驻波假定”是一样的),从而:
    ψ(0)=Asin0+Bcos0=B=0 \psi(0) = Asin0+Bcos0 = B = 0

    ψ(a)=Asin(ka)=0 \psi(a) = Asin(ka) = 0

    这样的边界条件不仅确定了波函数的形式,且确定了kk的离散性:显然,式(49)中A0A\neq0,不然波函数ψ(x)=0\psi(x)=0,是不可归一化的无意义解。从而sin(ka)=0sin(ka)=0,这也就意味着:
    ka=nπ,nN ka=n\pi, n\in N
    但是k=0k=0没有意义,它也会得到ψ(x)=0\psi(x)=0的无意义解,而且负的解不给出新解,这源于正弦函数的奇函数性质。从而经过合并,可区分的解为:
    ka=nπa,nN+ k_a = \frac{n\pi}{a}, n\in N_+
    这非常奇妙,在x=ax=a处的边界条件没有确定常数A,却确定了常数kk,因此我们得到了能量的表达式,即式(54)

    顺带一提,这个kk看似只是为了将微分方程转化为易于求解的形式,但它其实是具有物理意义的,在固体物理中这个kk称作“波矢”,是K空间和能带的单位度量。
    En=2kn22m=n2h28ma2 E_n = \frac{\hbar^2k_n^2}{2m} = \frac{n^2h^2}{8ma^2}
    这和经典情况完全不同,一个量子化的粒子在一维无限深势阱中的能量不是任意的,它只是这些离散的特殊许可值。利用归一化条件我们可以求出波函数的系数的模:A2=2a|A|^2 = \frac{2}{a},对AA我们可以简单地取其正根,从而势阱内波函数的解为:
    ψ(x)=2asin(nπax) \psi(x) = \sqrt{\frac{2}{a}}sin\left(\frac{n\pi}{a}x\right)
    如前所述的,解定态薛定谔方程会得到一个无限的解集(每个正整数n对应一个解),一维势阱内的波函数的形式是长度在aa的弦上的驻波,如图所示为此体系的前三个定态

    图2

    图2. 一维无限深方势井的前三个定态

    不难发现,随着能量的增加,态的节点(与x轴的交点)数逐次增1,对于第nn个量子态,其节点数目为n1n-1个。这一点对各类波函数的径向分布都是成立的。

    在各个定态中,ψ!\psi_!具有最低的能量,即称为”基态“,其它态的能量正比于n2n^2增加,它们称为”激发态“。不难发现E10E_1 \ne 0,因此量子体系是存在零点能的。这表明了运动的永恒性,它也是不确定性原理的必然结果。

    总的来说,由一维无限深势阱的波函数求解我们可以得到量子体系的如下特征:

    1. 粒子存在多种运动状态,它们可由ψ1,ψ2,...,ψn\psi_1,\psi_2, ... ,\psi_n等描述
    2. 能量量子化
    3. 存在零点能
    4. 微观粒子没有经典的运动轨道,只有概率分布
    5. 波函数及其对应的粒子分布均存在节点,节点多的组态能量高。

    2. 从势箱到平动能级

    一维无限深势阱的结论可以直接扩展到三维,这和一维薛定谔方程扩展到三维的方法一模一样,加个正交坐标就好了。在长,宽,高为lx,ly,lzl_x,l_y,l_z的三维无限深势阱中,其薛定谔方程用式(2)表达,从而其波函数解为:
    ψ=8lxlylzsin(nxπxlx)sin(nyπyly)sin(nzπzlz) \psi = \sqrt{\frac{8}{l_xl_yl_z}}sin(\frac{n_x\pi x}{l_x})sin(\frac{n_y\pi y}{l_y})sin(\frac{n_z\pi z}{l_z})
    式中nx,ny,nzn_x,n_y,n_z为三个方向自由度的“主量子数”,均为正整数。对应各波函数的能量表达式为:
    Exyz=h28m(nx2lx2+ny2ly2+nz2lz2) E_{xyz} = \frac{h^2}{8m}(\frac{n_x^2}{l_x^2}+\frac{n_y^2}{l_y^2}+\frac{n_z^2}{l_z^2})
    这就是微观粒子在三维(无限深)势阱中自由平动的能量表达式,对于分子、原子等质量相对较大,隧穿效应很不明显的微观粒子,可以用箱中粒子模型考虑它们的自由平动状态,认为粒子在碰到边界时会以完全弹性碰撞地形式被弹回,此时式(57)即为平动能级的表达式。

    3. 量子隧穿效应简介

    为确定平动能级能量表达式的适用范围,我们来简要考查一下量子隧穿效应。量子隧穿原理最简单的模型是一维方势垒,如图所示:

    图3

    图3. 一维方势垒示意图

    在高度为U的势垒中,粒子的薛定谔方程如下
    22md2dx2ψ(x)+Uψ=Eψ -\frac{\hbar^2}{2m}\frac{d^2}{dx^2}\psi(x)+U\psi = E\psi
    当粒子能量E>UE>U时,方程有如下解:
    ψ(x)=ψ(0)e±ikx,k=2m(EU)/ \psi(x) = \psi(0)e^{\pm ikx},k=\sqrt{2m(E-U)}/\hbar
    上式kk为波矢。而当粒子能量E<UE<U时,方程有如下解:
    ψ(x)=ψ(0)ekx,k=2m(UE)/ \psi(x) = \psi(0)e^{- kx},k=\sqrt{2m(U-E)}/\hbar
    此时kk为衰减因子,它描述电子波函数在水平方向xx的衰减。不难发现,即便是势垒U大于粒子的能量E,微观粒子在这个势垒内依然有存在非零的出现概率,只是这个概率和波函数一样呈指数级衰减而已,其正比于ψ(0)2e2kx|\psi(0)|^2e^{-2kx}。这就是量子隧穿效应,它表明微观粒子可以“渗透”穿过任何有限的势垒。

    粒子穿过势垒的概率可以表示为:
    T=[1+12(kq+qk)2sinh2(kW)]1 T = [1+\frac{1}{2}(\frac{k}{q}+\frac{q}{k})^2sinh^2(kW)]^{-1}
    其中q=2mE/q = \sqrt{2mE}/\hbar为粒子的初始波矢,W为势垒的轴向长度。其具体推导过程可以在任何一本量子力学书中找到。我们不难发现,若粒子的质量不是很小,在原子、分子级别,衰减因子kk的值偏大,微观粒子的隧穿效应呈指数形式快速衰减,其穿过势垒的概率T很小,隧穿效应是不需要考虑的,我们可以用之前给出的一维无限深势阱来考虑其平动能级。

    相应的,如果这个微观粒子是电子,其质量me=9.109×1031gm_e = 9.109\times10^{-31}g,远小于原子和分子的质量(质子mp=1.673×1027gm_p = 1.673\times10^{27}g),它的隧穿效应就相对明显,在微观尺度上需要考虑,即金属表面的电子存在克服功函势垒向表面外“逸出”的运动形式。这就是扫描隧道显微镜(STM)的原理基础。利用量子力学方法可以导出,在金属表面-真空-金属针尖模型中,电子能够在所加偏压VV远小于功函的情况下从金属表面隧穿到金属针尖形成隧道电流,但相应的,这样的隧道电流随针尖-样品的距离呈指数级衰减。具体原理可以查阅固体物理相关教材

    图4

    图4. 金属表面-真空-金属针尖的一维隧穿模型示意图

    2. 一维谐振子模型与振动能级

    经典谐振子的模型是一个质量为mm的物体挂在一个力常数为kk的弹簧上,其运动由胡克(Hooke)定律决定:
    F=kx=md2xdt2 F = -kx = m\frac{d^2x}{dt^2}
    此谐振子的振动情况遵循正弦波规律,忽略摩擦其解为:
    x(t)=Asin(wt)+Bcos(wt) x(t) = Asin(wt)+Bcos(wt)
    其中 ww为谐振子圆频率(角频率)
    w=km w = \sqrt{\frac{k}{m}}
    如果是两个由弹簧连接的物体组成的模型,如双原子分子模型,用它们间的约化质量代替上式中的m即可,约化质量μ\mu的表达式为:
    μ=m1m2m1+m2 \mu = \frac{m_1 \cdot m_2}{m_1+m_2}
    谐振子体系的势能为:
    V(x)=12kx2+V0 V(x) = \frac{1}{2}kx^2 + V_0
    V0V_0为零点能,为积分常数,取决于边界条件。其VxV-x图是抛物线状的。

    当然,没有完全理想的谐振子。如果弹簧伸长太多,胡克定律就会失效,弹簧甚至可能被破坏。但在实际中,任何势能在其极小值附近都可以用抛物线近似,如图所示:

    图5

    图5. 对任意势能极小值点附近的抛物线形(谐振子)近似

    形式上,如果我们将势函数V(x)V(x)在极小值附近做Taylor展开:
    V(x)=V(x0)+V(x0)(xx0)+12V(x0)(xx0)2+... V(x) = V(x_0)+V'(x0)(x-x_0)_+\frac{1}{2}V''(x_0)(x-x_0)^2+...
    在极小值处V(x0)=0V’(x_0) = 0,忽略高次项(只要xx0x-x_0很小就可以忽略),得到:
    V(x)=V(x0)+12V(x0)(xx0)2 V(x) = V(x_0)+\frac{1}{2}V''(x_0)(x-x_0)^2
    这正是描述x=x0x=x_0附近处谐振子的势,其有效弹性常数k=V(x0)k = V''(x_0)。事实上,任何振动形式,只要振幅足够小,都可以近似看做简谐振动,这就是谐振子为什么如此重要的原因。

    量子力学的问题是要解势能为:
    V(x)=12w2x2 V(x) = \frac{1}{2}w^2x^2
    时的定态薛定谔方程:
    22md2ψdx2+12mw2x2=Eψ -\frac{\hbar^2}{2m}\frac{d^2\psi}{dx^2}+\frac{1}{2}mw^2x^2 = E\psi
    这个方程的解法不同于势箱粒子,比较复杂,我们可以利用一种叫阶梯法的有趣方法,结合归一化方法解得谐振子模型的体系总能量的量子化能量表达(而波函数表达更加复杂):
    En=(n+12)w=(n+12)hν E_n = \left(n+\frac{1}{2}\right)\hbar w = \left(n+\frac{1}{2}\right)h\nu
    具体解法可以参照任意一本量子物理教材。值得注意的是,谐振子模型中势能与位置有关,但总能量应当是守恒的,也即此模型的总能量中不仅存在势能项还存在动能项。如果代入波函数的表达,我们可以证明:
    <V>=12w(n+12) \left<V\right> = \frac{1}{2}\hbar w\left(n+\frac{1}{2}\right)
    可以看出,势能的期待值正好是总能量的一半,而另一半当然是动能。事实上,线性谐振子的一个自由度上同时存在动能项和势能项,这点在后续的讨论中会多次提到。

    式(71)即为双原子分子的振动能级表达式,在很大程度上,作为一种分子简谐振动能级表达,它可以用于很多分子的各振动自由度上的的振动能级表达——因为各个振动自由度可以被近似认为定域在两个原子之间。进一步的精确表达需要对势函数做进一步的Taylor展开。
    在这里插入图片描述

    图6. 分子势能曲线表示图

    3. 转动能级

    双原子分子的转动能级推导用的是刚性转子模型,由于转动体系是自由的,只有动能,没有势能,从而:
    E=T=M22I E = T = \frac{M^2}{2I}
    其中MM为角动量。量子力学证明体系的角动量是量子化的,其值为:
    M=J(J+1)h2π,JN M = \sqrt{J(J+1)}\frac{h}{2\pi}, J \in N
    从而转动能级的表达式为:
    EJ=J(J+1)h28π2I E_J = J(J+1)\frac{h^2}{8\pi^2I}
    JJ可以称作分子的“总角量子数”,这个表达式可以利用统计热力学方法进行推广。需要注意的是,在量子力学刚性转子模型中,角动量不仅大小是量子化的,其方向也是量子化的,它用“总磁量子数“SS来表示,量子力学可以证明每一个转动能级上磁量子数的大小可以为:SJ=0,±1,±2,...,±JS_J = 0, \pm1, \pm2,...,\pm J,由于取向不影响能量大小,转动能级的每一个能级的简并度即为(2J+1)(2J+1),对应角动量的(2J+1)(2J+1)个取向。

    4.分子运动形式与分子光谱简介

    以上,我们将(双原子)分子的运动形式分成了平动(势箱模型),转动(刚性转子模型),振动(谐振子模型)三种运动形式,它们对应一个分子的三种能量形式。要将它们这几个分立的描述合起来描述一个分子的量子化行为,其必然要求是这几种运动形式是相互独立的,也即分子各个运动形式间应当具有独立性。

    一个分子事实上还具有电子能级和核能级,它们表示构成分子的电子和原子核的能级状态(包括能量、轨道对称性、空间分布状况等),尤其是分子的电子能级,它决定了分子的主要性质。如果这几种运动形式不能相互独立,那么,即使我们能熟练运用量子力学方法,分子体系的处理也将变得十分困难

    事实上,分子光谱实验的结果表明,各个不同的运动形式的能级差都分布在不同的数量级上,且各个运动形式的特征时间也分布在不同的数量级上。单独研究电子吸光的吸收光谱时,实验不但能重复地观察到固定的吸收峰,而且,只有在假定电子跃迁的同时原子核的位置不变的基础之上,电子光谱的一些精细结构才可以合理解释。这种定核近似的合理描述在光谱学中形成了著名的弗兰克-康登(Franck-Condon)原理。

    大量光谱学实验结果和理论分析表明,(同核双原子)分子的波函数可以分成五种运动形式的波函数部分的乘积:
    ψ=ψtψrψvψeψN \psi = \psi_t \cdot \psi_r \cdot\psi_v \cdot \psi_e \cdot \psi_N
    相对应的,分子的各种能级是量子化的,各种能级在一定条件下可以独立考虑,且各种运动形式耦合构成了整个分子的运动模式,即:
    εtotal=εt+εr+εv+εe+εN \varepsilon_{total}=\varepsilon_{t}+\varepsilon_{r}+\varepsilon_{v}+\varepsilon_{e}+\varepsilon_{N}
    这就是分子各种运动的独立性和耦合性。上两式各项分别对应平动、转动、振动、电子、核五种运动形式,它们对应的分子光谱情况示意如下:

    在这里插入图片描述

    图7. 分子光谱示意图
    能级 能隙大小 激发难易
    平动能级 ~1018eV,1019kT10^{-18}eV, 10^{-19}kT 极小
    转动能级 (0.05104)eV(0.05-10^{-4})eV, ~104kT10^{-4}kT 较小
    振动能级 ~0.05eV,10kT0.05eV, 10kT 中等
    电子能级 (0.15)eV(0.1 - 5)eV 较难
    核能级 >10eV>10eV 很难
    表1. 各运动形式能隙示意

    光谱(spectroscopy)是化学家观察世界和研究世界的眼睛,它们帮助化学家观察到原子分子尺度的分子运动,如果说晶体衍射打开了晶体研究的大门,STM打开了表面科学研究的大门,那么,原子分子光谱也就当之无愧地打开了一切原子分子层面的研究的大门。

    五、量子化学的自底向上

    无论是经典力学,还是量子力学,其基础都是偏微分方程,对于三个粒子以上的体系,其精确的解析解都是不存在的,从而,为了确实地解决多分子体系问题,我们有这样两条路可以走:

    1. 计算化学:量子化学方法的进一步发展

    1998年的诺贝尔奖授予了理论计算化学的两位奠基者Walter Kohn和John A. Pople,当时的颁奖词中如此写到:”化学已经不再是一门纯粹的实验科学“,今天,随着计算机科学和数学物理方法的快速发展,计算化学的理论和方法也迅猛成长着,开始展现出其强大的威力,现在的计算化学虽然还做不到“预测”的程度,但已经在化学研究中和实验化学并驾齐驱,互为补充。

    理论计算化学并不能说是一门新兴的学科,上个世纪以来,从最初的Hartree-Fock自洽场,到密度泛函理论和Kohn-Sham方程,再到如今一套套相对成熟的计算化学软件包和计算化学方法,其核心都是一个——求解多体体系的薛定谔方程,进而得到体系的全部性质。这些理论在当时没有得到认可,很大一部分原因在于当时的算力远远达不到这些理论方法的要求。时至今日,算力虽然依然是一个限制因素,但我们已经可以在利用计算化学软件,基于量子化学和从头计算法研究简单体系化学问题的同时,进一步发展更好的量子化学计算方法,来探求更多更大体系的理论模拟。

    理论模拟的可能并不代表我们能够抛弃实验,相反的——从实验中总结与感悟出来的那些化学的规律和直觉,往往是理论化学家区别于凝聚态物理和原子物理研究者的最大特色,这也是另一种层面上的”More is Different"。我们在用好计算机模拟方法的同时,一定不要忘了研究化学问题的初心,和综合化学理论的思维。

    2. 从量子化学到统计热力学

    化学所要处理的体系往往是多分子体系,而在粒子数多于10610^6个的多分子体系之中,最概然分布已经占到宏观体系中所有微观状态分布的统治地位。从而我们可以用最概然分布的特征来描写宏观体系平衡态,这就是统计热力学的理论基础。基于此,导出了经典的麦克斯韦-玻尔兹曼(MB)分布和量子化的玻色-爱因斯坦(BE)分布以及费米-狄拉克(FD)分布。从经典的MB分布向上可以导出宏观经典热力学的许多结论。

    事实上,结合量子化能级的经典MB分布已经可以自底向上地描述宏观热力学的微观图像,而总包了MB分布的宏观热力学作为“化学热力学”这门学科起着完美地多分子体系化学理论的作用。完善并运用好这套多分子体系理论,这应当是化学家们的努力方向。

    参考书目:

    1. 《量子力学》格里菲斯
    2. 《彭笑刚 物理化学讲义》
    3. 《物质结构》徐光宪
    4. 《结构化学基础 第四版》
    展开全文
  • 以水质分析、岩石化学组成检测资料为基础,分析了韩城矿区象山矿井奥灰水质的赋存与分布等水文地质背景,重点研究...水化学组分垂向上差异,由介质石膏含量及其溶解作用决定。在象山矿井深部奥灰水水动力条件较浅部活跃。
  • 化学方程式 程序实现

    2020-01-18 23:48:50
    5) 对于其他的一些特殊情况,如可逆化学方程式(事实上大部分的化学变化是可逆过程)用双向箭头表示,有些产生气体的分子后面需要用向上的箭头表示,在产生过程上还有可以加一些外界物理条件,产生沉淀需要说明等,...
  • 5) 对于其他的一些特殊情况,如可逆化学方程式(事实上大部分的化学变化是可逆过程)用双向箭头表示,有些产生气体的分子后面需要用向上的箭头表示,在产生过程上还有可以加一些外界物理条件,产生沉淀需要说明等,...
  • 5) 对于其他的一些特殊情况,如可逆化学方程式(事实上大部分的化学变化是可逆过程)用双向箭头表示,有些产生气体的分子后面需要用向上的箭头表示,在产生过程上还有可以加一些外界物理条件,产生沉淀需要说明等,...
  • 5) 对于其他的一些特殊情况,如可逆化学方程式(事实上大部分的化学变化是可逆过程)用双向箭头表示,有些产生气体的分子后面需要用向上的箭头表示,在产生过程上还有可以加一些外界物理条件,产生沉淀需要说明等,...
  • 运用电感耦合等离子质谱(ICP-MS)、X射线荧光光谱(XRF)、离子选择电极(ISE)、显微镜光度计和煤化学等方法,对山东济宁矿区的高硫煤(太原组16号煤层)与低硫煤(山西组3上煤层)剖面的煤岩、煤质和煤地球化学特征进行研究...
  • 5) 对于其他的一些特殊情况,如可逆化学方程式(事实上大部分的化学变化是可逆过程)用双向箭头表示,有些产生气体的分子后面需要用向上的箭头表示,在产生过程上还有可以加一些外界物理条件,产生沉淀需要说明等,...
  • 5) 对于其他的一些特殊情况,如可逆化学方程式(事实上大部分的化学变化是可逆过程)用双向箭头表示,有些产生气体的分子后面需要用向上的箭头表示,在产生过程上还有可以加一些外界物理条件,产生沉淀需要说明等,...
  • 5) 对于其他的一些特殊情况,如可逆化学方程式(事实上大部分的化学变化是可逆过程)用双向箭头表示,有些产生气体的分子后面需要用向上的箭头表示,在产生过程上还有可以加一些外界物理条件,产生沉淀需要说明等,...
  • 2020危险化学品经营单位主要负责人考试及危险化学品经营单位主要负责人模拟考试题库,包含危险化学品经营单位主要负责人考试答案解析及危险化学品经营单位主要负责人模拟考试题库练习。由安全生产模拟考试一点通...

    题库来源:安全生产模拟考试一点通公众号小程序

    2020危险化学品经营单位主要负责人考试及危险化学品经营单位主要负责人模拟考试题库,包含危险化学品经营单位主要负责人考试答案解析及危险化学品经营单位主要负责人模拟考试题库练习。由安全生产模拟考试一点通公众号结合国家危险化学品经营单位主要负责人考试最新大纲及危险化学品经营单位主要负责人考试真题出具,有助于危险化学品经营单位主要负责人复审模拟考试考前练习。

    1、【判断题】通过道路运输危险化学品的,托运人应当委托依法取得危险货物道路运输许可的企业承运。(  √  )

    2、【判断题】遇火、遇热、遇潮能引起燃烧、爆炸或发生化学反应,产生有毒气体的危险化学品可以露天存放,但不得在潮湿、积水的建筑物中储存。(  ×  )

    3、【判断题】通用机械的急停装置可以用来代替安全防护措施和其它安全功能。(  ×  )

    4、【判断题】危险化学品经营企业不得向未经许可从事危险化学品生产、经营活动的企业采购危险化学品,不得经营没有化学品安全技术说明书或者化学品安全标签的危险化学品。(  √  )

    5、【判断题】应按《化学危险品标签编写导则》编写危险化学品标签。(  √  )

    6、【判断题】从事危险化学品经营的单位应有符合国家规定的危险化学品事故应急预案,并配备必要的应急救援器材、设备。(  √  )

    7、【判断题】安全技术措施计划制度是生产经营单位生产财务计划的一个组成部分,是提高经济效益的重要保证制度。(  ×  )

    8、【判断题】任何单位和成年人都有参加有组织的灭火工作的义务。(  √  )

    9、【判断题】走私易制毒化学品的,由海关没收走私的易制毒化学品;有违法所得的,没收违法所得,并依照海关法律、行政法规给予行政处罚;构成犯罪的,依法追究刑事责任。(  √  )

    10、【判断题】危险化学品经营单位不得转让、买卖、出租、出借、伪造或者变造经营许可证。(  √  )

    11、【判断题】按事故频发倾向理论,事故频发倾向者的存在是工业事故发生的次要原因。(  ×  )

    12、【判断题】质量监督检验检疫部门负责核发危险化学品及其包装物、容器的生产企业的工业产品生产许可证,负责对进出口危险化学品及其包装实施检验。(  √  )

    13、【判断题】爆炸品仓库应为单层建筑,周围不宜装设避雷针。(  √  )

    14、【判断题】对于实行安全生产许可的生产经营单位,未应急预案备案登记的,在申请安全生产许可证时,可以不提供相应的应急预案备案登记表,仅提供应急预案。(  ×  )

    15、【判断题】输送易爆有毒的液化气体时应在压出管线上装有压力调节和超压切断泵的连锁装置、温控和超温信号等安全装置。(  √  )

    16、【判断题】《气瓶安全监察规程》规定,气瓶必须专用。只允许充装与钢印标记一致的介质,不得改装使用。(  √  )

    17、【判断题】电火花就是指事故火花。(  ×  )

    18、【判断题】事故单位应当按照负责事故调查的人民政府的批复,对本单位负有事故责任的人员进行处理。(  √  )

    19、【判断题】《非药品类易制毒化学品生产、经营许可办法》规定:国家对第一类非药品类易制毒化学品的生产、经营实行许可证管理。(  √  )

    20、【判断题】任何单位、个人不得损坏、挪用或者擅自拆除、停用消防设施、器材。(  √  )

    21、【判断题】安全技术说明书由化学品的生产供应企业编印,并由书店单独出售,如果用户需要,需要到书店购买。在交付商品时提供给用户,作为用户的一种服务,随商品在市场上流通。(  ×  )

    22、【判断题】按易燃液体闪点的高低分为低闪点液体、中闪点液体、高闪点液体。(  √  )

    23、【判断题】有毒作业环境管理中的组织管理包括对职工进行防毒的宣传教育,使职工既清楚有毒物质对人体的危害,又了解预防措施,从而使职工主动地遵守安全操作规程,加强个人防护。(  √  )

    24、【判断题】用人单位应当将工作过程中可能产生的职业病危害及其后果,有选择的告知劳动者。(  ×  )

    25、【判断题】国家建立统一领导、综合协调、分类管理、分级负责、属地管理为主的应急管理体制。(  √  )

    26、【判断题】生产经营单位未制定应急预案,导致事故救援不力或者造成严重后果的,由县级以上安全生产监督管理部门依照有关法律、法规和规章的规定,责令停产停业整顿,并依法给予行政处罚。(  √  )

    27、【单选题】2010年5月10日8时,b工程公司职工甲、乙受公司指派到c炼油厂污水处理车间疏通堵塞的污水管道。两人未到c炼油厂办理任何作业手续就来到现场开始作业,甲下到3m多深的污水井内用水桶清理油泥,乙在井口用绳索向上提,清理过程中甲发现油泥下方有一水泥块并有气体冒出,随即爬出污水井并在井口用长钢管捣烂水泥块。11时左右,当甲再次沿爬梯下到井底时,突然倒地。乙发现后立即呼救。在附近作业的b工程公司职工丙等迅速赶到现场,丙在未采取任何防护措施的情况下下井救人,刚进入井底也突然倒地,乙再次大声呼救,c炼油厂专业救援人员闻讯赶到现场,下井将甲、丙救出,甲、丙经抢救无效死亡。事故调查人员对污水井内气体进行了检测,测得氧气浓度19.6%、甲烷含量2.7%、硫化氢含量850mg/?。根据上述事实,导致两人死亡的直接原因是()。(  C  )

    A、甲烷浓度高,窒息死亡

    B、氧含量不够,窒息死亡

    C、硫化氢浓度高,中毒死亡

    28、【单选题】建设项目在竣工验收前,建设单位应当进行( )。(  B  )

    A、职业病危害检测与评价

    B、职业病危害控制效果评价

    C、职业病危害现状评价

    29、【单选题】在危险化学品生产或储存区域,如见到以下的标记,表示( )。(  B  )

    A、小心着火

    B、禁止穿钉子鞋

    C、禁止入内

    30、【单选题】《危险化学品经营企业开业条件和技术要求》规定了零售业务的范围,零售业务可以经营的危险化学品是( )。(  A  )

    A、强腐蚀品

    B、放射性物品

    C、.剧毒物品

    31、【单选题】产生职业病危害的用人单位应当在醒目位置设置公告栏,公布有关职业病防治的规章制度、操作规程、职业病危害事故应急救援措施和( )结果。(  B  )

    A、职工健康体检

    B、工作场所职业病危害因素检测

    C、职工职业病检查

    32、【单选题】工伤保险是国家通过立法手段保证实施的,对在工作过程中遭受人身伤害的职工或遗属提供补偿的一种( )。(  C  )

    A、优惠措施

    B、社会福利制度

    C、经济补偿制度

    33、【单选题】《中华人民共和国职业病防治法》规定( )依法享有职业卫生保护的权利。(  C  )

    A、用人单位

    B、单位职工

    C、劳动者

    34、【单选题】《中华人民共和国安全生产法》规定,从业人员有权拒绝( )和强令冒险作业。(  B  )

    A、错误指挥

    B、违章指挥

    C、应急指挥

    35、【单选题】在危险化学品的分类中,将易燃液体按闪点的高低分为( )项。(  A  )

    A、3

    B、4

    C、5

    36、【单选题】国家鼓励和支持研制、开发、推广、应用有利于职业病防治和保护劳动者健康的( )。(  C  )

    A、新技术、新工艺、新设备、新原料

    B、新技术、新装置、新设备、新材料

    C、新技术、新工艺、新设备、新材料

    37、【单选题】毒害品性质相抵的禁止( )。(  B  )

    A、分离储存

    B、同库存放

    C、分库存放

    38、【单选题】在劳动过程、生产过程和生产环境中存在的危害劳动者健康的因素,称为( )。(  A  )

    A、职业病危害因素

    B、劳动生理危害因素

    C、劳动心理危害因素

    39、【单选题】《中华人民共和国消防法》规定,企业对建筑消防设施( )至少进行一次全面检测,确保完好有效,检测记录应当完整准确存档备查。(  B  )

    A、每月

    B、每年

    C、每周

    40、【单选题】《使用有毒物品作业场所劳动保护条例》规定,劳动者在已订立劳动合同期间因工作岗位或者工作内容变更,从事劳动合同中未告知的存在( )的作业时,用人单位应当如实告知劳动者,并协商变更原劳动合同有关条款。(  C  )

    A、危险

    B、有毒

    C、职业中毒危害

    41、【单选题】危险化学品零售业务店面总质量不能超过( )t。(  B  )

    A、1

    B、2

    C、4

    42、【单选题】年度检查是指压力容器运行中的在线检验,每年至少( )次。(  A  )

    A、1

    B、2

    C、3

    43、【单选题】从事危险化学品零售业务的店面内只许存放( )的危险化学品,其存放总量不得超过1吨。(  A  )

    A、民用小包装

    B、工业用小包装

    C、民用大包装

    44、【单选题】《易制毒化学品管理条例》规定,易制毒化学品第一类可以用于( )。(  A  )

    A、制毒的主要原料

    B、制毒的辅助原料

    C、制毒的化学配剂

    45、【单选题】运输危险化学品的车船及其它运输工具( )搭乘无关人员。(  B  )

    A、可搭乘1人

    B、禁止

    C、允许搭乘多名

    46、【单选题】低、中闪点液体、一级易燃固体、自燃物品、压缩气体和液化气体类应储存于( )级耐火建筑的库房内。(  A  )

    A、一

    B、二

    C、三

    47、【单选题】根据《工伤保险条例》,职工在工作时间和工作场所内,因履行工作职责受到暴力等意外伤害,但本人吸毒的,( )认定为工伤。(  B  )

    A、应当

    B、不得

    C、视具体情况而定

    48、【单选题】《使用有毒物品作业场所劳动保护条例》规定,使用有毒物品作业的用人单位有关( )应当熟悉有关职业病防治的法律、法规以及确保劳动者安全使用有毒物品作业的知识。(  A  )

    A、管理人员

    B、业务员

    C、办事员

    49、【单选题】一般来说,可燃物中( )的火灾危险性较小。(  C  )

    A、气体

    B、液体

    C、固体

    50、【单选题】职业安全健康管理体系的建立与保持,可以全面提高企业的安全管理水平,在事故管理表现为( )。(  B  )

    A、事故处理

    B、事故预防

    C、事故的“四不放过”

    以上是2020危险化学品经营单位主要负责人考试及危险化学品经营单位主要负责人模拟考试题库。支持全国各地区精准危险化学品经营单位主要负责人考试试题,支持安全资格证,特种作业操作证,职业技能鉴定等工种题库练习。

    展开全文
  • 通过对兖州矿区东滩煤矿中奥陶系地层的水质资料分析,计算并绘制获得地下水中水文地球化学指标与奥灰含水层顶板标高的线性拟合图及函数关系。...奥陶系灰岩岩溶发育特征在垂向上整体具有弱—强—弱的变化规律。
  • 计算化学的深度学习

    万次阅读 2018-03-05 22:56:37
    【综述】计算化学的深度学习 全文基于谷歌翻译,语句多有不通顺 摘要 人工神经网络的兴衰在计算机科学和计算化学的科学文献中都有详细记载。然而近二十年后,我们现在看到了对深度学习兴趣的复兴,这是一种...

    Deep Learning for Computational Chemistry

    【综述】计算化学的深度学习

    全文基于谷歌翻译,语句多有不通顺


    摘要

    人工神经网络的兴衰在计算机科学和计算化学的科学文献中都有详细记载。然而近二十年后,我们现在看到了对深度学习兴趣的复兴,这是一种基于多层神经网络的机器学习算法。在过去的几年里,我们看到了深度学习在许多领域的变革性影响,尤其是在语音识别和计算机视觉领域,在这些领域的大多数专家从业人员现在经常避开之前建立的有利于深度的模型学习模型。在这篇综述中,我们对深层神经网络理论及其独特性质进行了介绍性概述,将它们与化学信息学中使用的传统机器学习算法区分开来。通过概述深度神经网络的各种新兴应用,我们强调它的普遍性和广泛的适用性,以应对该领域的各种挑战,包括定量结构活性关系,虚拟筛选,蛋白质结构预测,量子化学,材料设计和财产预测。在回顾深度神经网络的表现时,我们观察到在不同的研究课题中,针对非神经网络最先进的模型的一致表现优异,而基于深度神经网络的模型通常超出了各自任务的“玻璃天花板”预期。加上用于训练深度神经网络的GPU加速计算的成熟度以及用于训练这些网络的化学数据的指数增长,我们预计深度学习算法将成为计算化学的宝贵工具。

    介绍

    深度学习是AlphaGo开发过程中使用的关键算法,AlphaGo是由Google开发的Go-playing程序,在2016年击败了顶级人类玩家。 在棋盘游戏中击败人类玩家的计算机程序的发展并不新鲜; IBM的棋牌电脑Deep Blue在二十年前的1996年击败了顶级棋手。不过,值得注意的是Go可以说是世界上最复杂的棋盘游戏之一。 在19 *19板上玩,大约有10170个法律职位可以玩。 与Go的复杂性相比,据估计Lipinski虚拟化学空间可能只包含1060个化合物。

    深度学习是一种机器学习算法,与计算化学中各种应用中已经使用的算法不同,从计算机辅助药物设计到材料性质预测。其中一些更高调的成果包括2012年默克活动预测挑战,其中 一个深层的神经网络不仅赢得了比赛,而且超越了默克的内部基线模型,但是在他们的团队中没有一名化学家或生物学家的情况下这样做。 在一个不同的研究团队的不断取得的成功中,深度学习模型在2014年NIH发布的Tox21毒性预测挑战中取得了最高的地位。在最近的这些例子中,深度学习模型在预测活性和毒性方面的异常出色的表现来源于独特的特点,区别于传统机器学习算法的深度学习。

    对于那些不熟悉机器学习算法复杂性的人,我们将重点介绍一些主要差异-传统(浅层)机器学习和深度学习之间。机器学习算法最简单的例子就是无所不在的最小二乘线性回归。在线性回归中,模型的基本性质是已知的(在这种情况下是线性的),而输入(也称为模型的特征)彼此是线性独立的。通过变换原始数据(即平方,取对数等)可以将额外的复杂性添加到线性回归中。随着更多这些非线性项被添加,回归模型的表现力增加。这个描述突出了传统(浅)机器学习的三个特点。首先,这些功能由领域专家提供。在一个被称为特征提取和/或工程的过程中,应用了各种变换和逼近,这可以从第一原理出发,或者可能是众所周知的近似,甚至是受过教育的猜测。其次,浅层学习是模板匹配。它不会学习问题的表示,它只会学习如何精确地平衡一组输入要素以产生输出。第三,它的表达能力随着项的数量(即要拟合的参数)而增长,但如果非线性变换选择得不好,它可能需要指数多项。 例如,简单的幂级数展开将需要大量的项(和参数)来适应具有大量振荡的函数。
    图1. a)

    图1. a)具有一个隐藏层的传统前馈人工神经网络(ANN)的示意图。 每个表示为圆圈的神经元接受一系列n个输入值,并将其映射到使用非线性函数的输出,并将隐含层的所有神经元应用于偏置项(即输入为零时的神经网络输出)。 b)深度神经网络(DNN)与人工神经网络的不同之处在于具有多个(n> 3)隐藏层,如示意图所示,为简单起见,这里省略了偏差项

    目前开发的绝大多数深度学习算法都是基于人工神经网络的,为了本次审查的目的,我们将专注于深度神经网络。在本综述的前半部分,我们将提供深入学习的简要非技术性介绍,从人工神经网络的基本背景开始,并突出介绍在过去十年中使深度神经网络成为可能的关键技术发展。此外,我们将重点关注深度学习与计算化学中使用的传统机器学习算法的不同之处,以及深度学习正在进行的复兴与20世纪80年代的人工神经网络模型如何不同,后者可能被视为其“父”算法。在接下来的半年回顾中,我们将对计算化学领域的深度学习应用的最新发展进行调查,我们将根据现有的机器学习模型来检验其性能,以及为该领域做出贡献的未来前景。这篇评论主要是为了作为计算化学家的介绍入口,这些计算化学家希望从应用的角度探索或整合深度学习模型在他们的研究中,并且将提供对现有文献综述的更多参考资料,以涵盖更深层次的技术方面学习神经网络结构和优化。

    深度学习101

    人工神经网络(ANN)是大多数深度学习算法的基础,它是一类受生物神经网络启发的机器学习算法,用于通过将大量输入转换为目标输出来估计或近似函数。 1a)中,人工神经网络由一系列层构成,每层包含许多“神经元”。每个神经元接受来自前一层的输入值,并将其映射到非线性函数上。该函数的输出用作ANN中下一层的输入,直到它到达最后一层,输出对应于要预测的目标。此外,可调参数,每个神经元函数的“权重”(或系数)在构建该模型时进行调整,以最小化预测值的误差,这一过程称为“训练”神经网络。形象地说,人工神经网络中的这些神经元的集合模仿神经元在生物系统中的工作方式,因此其名称为人工神经网络。

    在反向传播过程中,使用称为梯度下降的算法来在生成相应输出时查找由各个神经元引起的误差表面中的最小值。 从概念上讲,梯度下降与经典分子动力学模拟中使用的最速下降算法没有区别。 主要区别在于迭代地最小化能量函数并更新每个步骤的原子坐标,迭代地使ANN的目标输出的误差函数最小化并且每步更新神经元的权重,在ANN文献中,这也被称为“迭代”。 训练集中的数据可以迭代多次,并将数据完整地传递为“epoch”。
    反向传播的一个关键问题是随着信号通过每个隐藏层,误差信号逐渐变得更加分散。 这是因为信号发生了在模型更深处,越来越多的神经元和权重与给定的误差相关联。 直到最近,这使得很难有效地训练许多层; 超过几层的任何东西都需要很长时间才能收敛到过度拟合的高可能性,特别是对于最接近输出的层。 此外,非线性变换函数(如S形)具有有限的动态范围,因此误差信号在通过多个层时趋于衰减,这通常称为“消失梯度问题”。

    自1986年以来,已经开发了几种关键算法,包括无监督预训练,纠正线性函数和dropout,以改进人工神经网络的训练过程,解决消失梯度问题,并减少过拟合人工神经网络特别容易受到影响。也许是训练深度神经网络(DNN)的最大障碍,是渐近问题的消失,因为它实际上限制了神经网络的深度。预训练,由Hinton等人发现。在2006年是一种快速,贪婪的算法,它使用无监督的分层方法一次训练DNN一层。预训练阶段完成后,将使用更细微的微调过程(例如随机梯度下降)来训练模型。使用预训练方法,模型在反向传播开始之前就已经学会了这些特征,从而减轻了消失梯度问题。 2011年出现了另一种解决方案,Bengio及其同事证明整流线性激活(ReLU)函数完全避开了消失梯度问题。 ReLU的一阶导数恰好为1或0,通常可以确保误差信号能够反向传播而不会消失或爆炸。 (图2)。图2

    图2. a)S形和 b)整流线性(ReLU)函数(蓝色)及其相应的一阶导数(红色)的图。 与sigmoidal函数不同,其中的导数根据x的值而变化,在ReLU函数中,一阶导数为0或1。[Color figure can be viewed at wileyonlinelibrary. com]

    总结了人工神经网络及其相关算法的主要发展情况后,我们注意到它并不全面。除了迄今为止讨论的传统的前馈DNN(图1b)之外,更近期的发展包括替代架构,特别是卷积神经网络(图3a),递归神经网络(图3b),和自动编码器(图3c),这些在计算机视觉和自然语言处理应用中都非常成功。关于各种DNN体系结构的技术讨论,虽然对深入学习文献有深刻理解,但超出了本文的讨论范围,因此,我们向读者推荐以下出版物总结这一研究课题。现在,应该明显看到,ANN本身不是一项新发明。事实上,人工神经网络的数学算法是由McCulloch和Pitts在1943年开发的,实际上可训练的人工神经网络可追溯到1986年,与Rumelhart,Hinton和Williams等人发明神经网络的后向传播一致。更深层次的神经网络超越了几个隐藏层(图1b),只有在最近几年更新的算法发展才能实现。因此,DNN不仅仅是上个世纪人工神经网络的重塑品牌,它又如何更好比已经成功用于各种化学信息学应用的传统机器学习算法?
    图三

    图3. a)卷积神经网络(CNN)的示意图。 CNN的设计明确假定输入是以图像数据的形式。 每个卷积层提取和保存空间信息并学习一个表示,然后典型地将其传递到输出层之前的传统完全连接的前馈神经网络。 b)循环神经网络(RNN)的示意图。 最简单实现的RNN是对标准前馈神经网络的修改,其中隐藏层中的每个神经元从模型的前一次迭代的输出接收附加输入,表示为“t-1”圆形箭头。 c)自编码器的示意图,它是用于无监督学习的神经网络。 在自动编码器中,目标是学习输入层的标识函数,并且在该过程中,隐藏层中原始数据的压缩表示被学习。

    数十年的化学研究已经导致了几千种分子描述符的发展,这些描述符描述了可以想到的任何化合物的一系列性质。因此,分子描述符用作使用化学知识和直觉(即领域专业知识)构建的特征,其可用于传统的机器学习模型,其已经在计算化学应用中取得了合理的成功。传统的机器学习算法(如线性回归和决策树)非常直观,可以创建人类可以理解的简单模型。尽管如此,随着我们对具有非线性关系的更复杂属性(通常是与生物过程和材料工程相关的属性)的预测进展,通常需要依赖更复杂且不太透明的算法,如支持向量机(SVM)和随机森林 (RF)达到可接受的预测准确度。乍一看,深度学习算法属于后一类,但它有一个主要区别。与SVM和RF不同,DNN转换输入并将其重构为跨隐藏层的神经元的分布式表示。通过适当的训练方法,系统隐藏层中的神经元将学习不同的特征;这被称为自动特征提取。由于每个隐藏层都成为系统下一层的输入,并且可以沿途应用非线性转换,因此它会创建一个逐渐“学习”越来越抽象,层次和深度特征的模型。

    自动特征提取是一个不需要领域知识的过程,因此是深度学习算法最重要的优点之一。这与传统的机器学习算法不同,在这种算法中,模型必须用基于化学知识和直觉的“正确”特征仔细构建,以便其执行和推广。正因为如此,深度学习已成为语音识别和计算机视觉中的主流算法。 ImageNet是用于图像分类的各种算法的年度评估和竞争。在进行深度学习之前,所采用的最先进的模型徘徊在25-30%的错误率,这与理想的匹配5.1%经过训练的人为错误率的理想目标相距甚远。 2012年,Hinton及其同事首次向这个社区介绍了深度学习算法,他们的基于DNN的模型实现了16.4%的错误率。这是当时计算机视觉中已建立的模型的显着改进,而基于传统机器学习算法的次高性能模型仅实现了26.2%的错误率。随后在基于DNN的模型中的改进最终实现了5.0%以下的错误率,超过了2015年的人类表现(图4),这是深度学习引入计算机视觉领域后仅3年对于这些领域的从业人员来说,深度学习和自动特征提取能力的影响已经发生了变革,不仅超越了该领域的“玻璃天花板”期望的超越能力,而且实现它的时间也显着缩短。近年来,深度学习在计算机科学领域以外的其他学科中也有所表现,包括高能粒子物理和生物信息学。

    图4

    图4. 年度ImageNet竞赛中表现最好的图像分类算法的历史错误率。已建立的计算机视觉模型停滞在25-30%。 2012年引入深度学习使得图像分类的显着改善达到了~15%,到2015年实现了图像分类的人类精确度(~5%)。

    还没有讨论过的深度学习的一个同样重要的方面是多年来非算法发展的作用。具体来说,由于上个世纪缺乏“大数据”的可行性和GPU硬件的技术进步,导致了DNN的出现不同于上个世纪的ANN。 2012年的开创性工作被广泛认为是推动深入学习受到关注的文章,是Hinton的AlexNet论文。虽然算法的发展,尤其是dropout促成了它的成功,但可以获得包含120万张图像的更大的数据集到图像中使用的10,000幅图像的数据集,也对其成功起到了关键作用。随着更深更大的神经网络的发展,训练时间通常可能延长至数天或数周。然而,就像计算化学领域如何从GPU加速计算的兴起中受益一样,该技术也减轻了DNN的训练速度问题。

    在更实际的考虑中,用于在GPU上训练神经网络的开源代码和文档的可用性也可以说是近年来深度学习快速扩散的另一个原因,包括其对学术研究的影响,这可以通过自2010年以来深度学习相关出版物指数级增长看出来(图5a)。就像现代大多数计算化学家不再编写他们自己的代码来执行分子动力学模拟或运行量子化学计算一样,而是依赖于已建立的软件包,深度学习研究团队也已达到类似的成熟度水平,目前用于训练神经网络的主要软件包,包括Torch,Theano,Caffe和Tensorflow。Torch也许这四者中最古老的一个,其作为一种机器学习科学计算框架于2002年首次在纽约大学发布,自那时起,深度学习库被添加。 Theano是2008年由Benjio及其同事在蒙特利尔大学发布的第一个专门开发的深度学习框架,之后,该框架已发展成为一个由250多名贡献者组成的社区团队。 2014年由伯克利视觉与学习中心开发的Caffe的发布紧随其后。最近,由谷歌开发的Tensorflow于2015年下半年发布,可以说在深度学习社区中的吸引力激增,从谷歌搜索排名的高峰(图5b)可以看出,以及它的Github已经分别出演了33,000次和14,000次,尽管它仅仅在一年多的时间内发布了一次。此外,2015年发布的Keras等API大大简化了神经网络的构建和培训,显着降低了新的深度学习从业者的入门门槛。
    图5

    图5. 来自ISI索引的 a)深度学习出版物的增长情况,以及 b)2010年以来主要深度学习软件包的年度Google趋势得分。

    毫无疑问,计算机科学领域一直是从互联网上获得的可挖掘数据激增的主要援助者(图6a),毫不奇怪,深度学习的影响力也是最大的。在化学领域,我们也看到了可公开访问的数据库(如Protein Data Bank(图6b)和PubChem(图6c))中数据的相应增长,其中更多的数据来源于最新的高通量组学技术[53]。正是由于这些原因,我们对计算化学领域开始经历同样的事件汇合感到乐观,这将极大地促进我们领域的深度学习应用。我们可以利用计算机科学领域的算法突破,化学数据的日益增加的可用性,以及现在成熟的GPU加速计算技术。[ 图6d; GPU计算能力数据点来自所报道的双精度(2010),M2090(2011),K20(2012),K40(2013),K80(2014),P100(2015)计算NVIDIA Tesla系列GPU的计算能力。]
    图6

    图6. a)生成的全球数据,b)保存在蛋白质数据库中的结构数量,c)保存在Pub-Chem中的化合物数量,以及d)用于科学计算的GPU计算能力(GPU计算功率数据点 (2010年),M2090(2011年),K20(2012年),K40(2013年),K80(2014年),P100(2012年),P100(2011年),NVIDIA Tesla系列GPU的双精度计算能力, 2015)),在它们向上的轨道上都有类似的相似之处

    计算机辅助药物设计

    在计算机辅助药物设计中,传统的机器学习算法在化学信息学领域有着悠久的历史,特别是它们对量化结构活性关系(QSAR)应用的贡献。在QSAR中,要预测的输出通常是化合物的生物活性。通常使用回归模型,并且输入数据是分子描述符,其是根据化学领域知识设计的分子的预先计算的物理化学性质。 QSAR应用的早期工作使用线性回归模型,但这些模型很快被贝叶斯神经网络所取代,随后是RFs和SVMs 。该领域的从业者历来喜欢允许可变选择的模型,以便知情的化学家可以确定选定的特征是否有意义。此外,也允许评估输出预测不确定性的模型。 QSAR领域非常广泛,我们向读者推荐以下关于历史关键技术发展的评论列表[57-60]。为了进行本次审查,我们将讨论的范围限制在基于DNN的QSAR模型的性能和适当比较传统的机器学习模型。

    深入学习QSAR的第一次尝试是2012年的默克挑战。 在这个公开的挑战中,团队提供了化合物的预计算分子描述符及其相应的实验测量活动,共计15个药物靶标。 提交的模型评估了他们根据没有发布给参与者的测试集预测活动的能力。 获胜组使用DNN模型,由达尔领导,他是Hinton研究团队的一员。值得注意的是,应该强调的是,该团队没有受过正式训练的计算化学家。 他们来自计算机科学系。

    2014年,Dahl等人根据Merck挑战中使用的算法提交了预发布论文,探讨了多任务神经网络在QSAR应用中的有效性。在这项工作中,作者使用了一个多任务DNN模型。在这里,“多任务”指的是一种模型,它不仅预测单个感兴趣的输出,而且预测同时多个输出,在他们的情况下是19次分析的结果。使用的数据集来自PubChem,包含超过100,000个数据点。分子描述符每个分子总共3764个描述符使用Dragon生成,并且它们被用作DNN的输入特征。在与其他传统机器学习算法(例如梯度推进决策树和逻辑回归)相比的准确性性能基准中,基于DNN的模型在19个化验预测中的14个中的表现优于统计上显着的余量,并且在性能剩余的5个化验预测。另外,作者指出了多任务神经网络的优点,特别是它为多任务开发了一个共享的,学习的特征提取流水线。这意味着不仅可以学习更一般的特征产生更好的模型,而且多任务DNN中的权重也受到更多数据案例的约束,从而分享统计强度。最后,该研究的一个有趣的观察结果是DNN如何处理数以千计的相关输入特征,这与Winkler在2002年强调的传统QSAR智慧相反,尽管我们注意到Winkler当时发表的观察结果是在开发DNN之前。在达尔的工作中,作者观察到,将输入特征减半不会导致性能下降。

    Merck于2015年发表的一项随后研究综合分析了DNN的培训,并将其性能与该领域当前使用的基于RF的模型的性能进行了比较,并将其扩展到Merck挑战数据集。作者总结说,DNNs可以作为一种实用的QSAR方法被采用,并且在大多数情况下容易胜过射频模型。就实际采用而言,作者强调了DNN利用的GPU硬件的巨大进步,以及与传统机器学习模型使用的传统CPU集群相反的部署GPU资源的经济成本优势。还研究了与训练深度神经网络相关的关键问题,特别是可调参数的数量。作者发现,大多数单任务问题可以在具有两个隐藏层的架构上运行,每层仅使用500-1000个神经元,并且使用75个训练时期。更复杂的体系结构和/或更长的培训时间可以提高模型精确度的回报,但增量递减。尽管在上文总结的Merck挑战和相关研究中,DNN总体上表现良好,但研究界的一些从业人员对此结果持怀疑态度。常见的问题包括样本量小,并且面对模型复杂性的增加,预测准确性的渐进式改进难以证明其合理性。

    2014年,Hochreiter及其同事在神经信息处理系统(NIPS)会议上发表了一篇同行评议的论文,讨论如何将多任务DNN应用于QSAR应用于一个更大的数据集。在这项研究中,作者策划了整个ChEMBL数据库,该数据库比原始Merck挑战数据集大两个数量级。该数据集包括743,336种化合物,约1300万种化学特征和5069种药物靶标。有趣的是,作者没有使用明确计算的分子描述符作为输入数据,而是使用了ECFP4指纹。作者对1230个目标的DNN模型的准确性进行了基准测试,并将其与传统的机器学习模型(包括SVM,逻辑回归等)进行了比较。应该指出,在2014年Dahl的论文中,梯度提升的决策树与DNN差不多,并未包含在本研究中。然而,事实表明,DNNs的表现优于所有测试的模型,其中还包括两家商业解决方案和三家制药公司目前实施的解决方案(图7)。虽然大多数传统机器学习算法的准确度范围为0.7至0.8 AUC,但DNN达到了0.83的AUC。在更好的表现模型(AUC> 0.8)中,DNNs也具有最不严重的异常值,这些作者假设是由于DNN的共享隐藏表示使得它能够预测单独检查时难以解决的任务。与达尔2014年的研究一致,多任务DNN的使用赋予了两个优点:(i)允许多标记信息,因此利用任务之间的关系和(ii)允许在预测任务之间共享隐藏的单位表示。这项研究的作者指出,第二个优点对于一些仅有少量测量数据的药物靶标特别重要,因此表明单个目标的预测可能无法构建有效的表示。使用多任务DNN可以部分缓解这个问题,因为它可以利用跨不同任务学习的表示,并且可以用较少的训练示例提高任务的性能。此外,DNN提供了化合物的分层表示,其中更高层次表示更复杂的概念,这些概念可能会超出训练集数据的潜在更多转移。
    图7

    图7.深度神经网络与几种传统机器学习算法的性能准确性(就AUC度量而言),包括:支持向量机(SVM),逻辑回归(LR),k-最近邻(k-NN)和商业实现 解决方案(Pipeline Pilot Bayesian分类器,分别基于Parzen-Rosenblatt KDE的方法和相似性集成方法),用于从ChEMBL获得的策展数据库的活动预测。

    Pande group和Google在2015年向arxiv提交了一项类似的大规模研究。在这项研究中,确定了大约200个药物靶点,但包括了更多的数据点(4000万)。与早期的NIPS论文不同,Pande及其同事将调查重点放在了DNN多任务学习的有效性上,而不是DNN模型本身的性能。作者策划了一个数据库,该数据库由多个公开数据源组成,包括来自PubChem数据库的PCBA ,来自17个具有挑战性的虚拟筛选数据集的MUV ,DUD-E组[和Tox21数据集。与Hochreiter及其合作者一样,这些分子使用ECFP指纹进行了修饰,并且没有计算明确的分子描述符。主要研究结果中,一直观察到多任务绩效改善,但其他数据或额外任务在改善绩效方面是否有较大影响并不明显。作者还观察到训练集中未包含的任务的转移能力有限,但效果并不普遍,并且在成功运行时需要大量数据,这部分强化了Hochreiter和Dahl提出的多任务学习优势的主张。奇怪的是,从一个数据集到另一个数据集,多任务改进程度各不相同,并且没有提供令人满意的解释。尽管如此,多任务DNNs与逻辑回归和RF等传统机器学习模型的一致性能显着(图8),其中AUC的性能提升范围从0.02到0.09。

    图8

    图8.当使用多任务深度神经网络(MT-DNN)时,与逻辑回归(LR)、随机森林和单任务神经网络(ST-NN)相比,在3个不同数据库(PCBA,MUV,Tox21)中观察到的准确性(以AUC度量指标) (RF)。

    迄今为止,至少有四个DNN报告应用于QSAR,一致的观察结果表明深度学习优于传统的机器学习对手。然而,所有研究都主要集中在生物活性预测上。从概念上讲,DNN在预测其他感兴趣的性质(其可能包括ADMET性质)以及在计算机辅助药物设计的其他部分中的应用(例如在虚拟筛选中)应该具有类似的性能。

    药物性肝损伤(DILI)是过去五十年中安全性相关药物撤药的最常见原因。 DILI的机制是复杂和多样的,在人类中引起DILI的药物不易通过常规方法探测,使DILI的毒理学研究变得困难。徐等人最近的一项研究表明,使用DNN预测DILI毒性。作者使用了Mold和PaDEL计算的显式分子描述符,以及Lusci等开发的URGNN分子构建编码方法作为DNN的输入数据。该模型接受了475种药物的培训,其中198种药物的外部测试集合,使用DNN的最佳模型的准确率为86.9%,灵敏度为82.5%,特异性为92.9%,AUC为0.955。相比之下,传统模型的绝对性能指标降低了10-20%。有趣的是,使用来自URGNN分子结构编码方法的输入,作者创建了性能最高的模型(AUC 0.955),优于经类似训练的DNN,其使用来自Mold(AUC 0.931)和PaDEL(AUC 0.895)的计算分子描述符。这表明,一种好的分子编码方法如UGRNN可能更有效地为DNN提供必要的特征,因为深度学习算法具有自动提取必要特征的能力,并且这种能力可能相当于或甚至可能优于域通过开发明确的分子描述符来进行专家特征工程。

    Swamidass及其同事于2015年发布了DNN建模毒性的另一个应用。药物毒性的一种常见机制源自与蛋白质共价结合的亲电子反应性代谢物。环氧化物是这种性质的官能团,其通常由药物分子的细胞色素P450代谢形成,其作用于芳族或双键。 Swamidass和同事的结果特别有特色,因为他们开发了DNN模型来预测经历环氧化的分子的特定位置,即其环氧化(SOE)位点。这项工作的基础是早期的模型Xenosite,一种基于ANN的小分子P450代谢模型,尽管它是一个浅层网络,但它已经超越了基于SVM的模型的精确度高达5%。随后通过研究使用不同类型的分子指纹对P450代谢建模的影响进一步改进,他们发现使用不同指纹类型的共识模型可以获得进一步的准确性增加和预测的相关姊妹模型葡萄糖醛酸化代谢的位点。在他们最近关于环氧化物基毒性预测的工作中,Swamidass及其同事设计了一种4层DNN结构,并在702环氧化反应数据库上训练了模型,并鉴定出94.9%AUC性能的SOE,并将其分离(即分类)具有79.3%AUC的环氧化和非环氧化分子。此外,在环氧化分子内,该模型能够通过将芳香族或双键SOEs与所有其他芳族或双键分别具有92.5%和95.1%的AUC分离来提供原子级精确信息。这使得DNN模型成为文献中的第一个机理模型,它不仅预测候选药物的反应性环氧化物的形成,而且准确地识别分子中的特定环氧键。 Swamidass及其合作者使用类似的DNN模型模拟了小分子对软亲核试剂如谷胱甘肽(GSH)的反应性位点。通过仅对定性反应性数据进行培训,他们能够构建基于DNN的模型,其以90.8%的准确度识别反应性分子内的反应性位点,并分离具有80.6%准确度的反应性和非反应性分子。此外,该模型的预测与更具化学多样性的外部数据集中的定量GSH反应性测量结果相关性很好,这表明该模型在更大面积的化学空间范围内具有普遍性。随后的出版物扩大了该模型的范围,以涵盖对GSH,氰化物,蛋白质和DNA的反应性。由此产生的模型对DNA进行交叉验证的AUC性能为89.8%,对于蛋白质为94.4%,并且将来自非反应性分子的亲电子反应性分子与DNA和蛋白质分开,交叉验证的AUC性能分别为78.7%和79.8% 。此外,该模型的表现也显着优于用QM方法计算的反应性指数。由于药物毒性通常是由亲电子反应性代谢产物引起的,因此有助于识别位点反应性研究的模型(迄今为止在文献中显着缺失)可以用于构建基于机制的分子毒性预测。

    2016年Hochreiter集团最近还发布了一项关于化学毒性的大规模研究。在这项工作中,作者报告了2014年NIH发布的针对Tox21数据挑战的DNN模型的应用。该数据库由12,000种环境化学品和药物组成,并且它们在12种不同测定中的相应测量被设计用于测量多种毒性效应。毫不奇怪,由Hochreiter及其同事开发的DeepTox模型在提交给Tox21挑战的所有方法中性能最高。对其模型的进一步分析表明,使用多任务DNN模型导致在12个化验预测中的10个中与单任务模型相比有一致的优势。传统机器学习算法(包括SVM,RF和Elastic Net)的其他基准也证明了DNN在15个案例中有10个胜出。最后,尽管最初的DeepTox模型使用NIH提供的分子描述符在Tox21挑战中,作者还表明,仅使用ECFP4指纹作为输入数据开发的类似训练的DNN模型具有与那些在显式分子描述符上训练的类似的性能,其类似到Xu等人的观察。在他们的DILI毒性模型中。有趣的是,在可视化这些DNN的第一个隐藏层时,作者观察到该层中99%的神经元与至少一个已知毒性特征具有显着关联,这表明深度学习可能支持发现新的化学知识其隐藏层。

    根据QSAR和毒性预测的进展,深度学习算法也开始对计算机辅助药物设计的其他方面产生影响。 2013年,Baldi和同事报告使用DNN模型预测分子溶解度[78]。 Pande及其同事还向arxiv提交了此方向最近的研究进展,他们开发了一个多任务DNN模型,用于预测不仅溶解度,而且预测ADMET性质的整个范围。深度学习在虚拟筛选方面也可能具有未来作为现有对接方法的可行替代或补充。 2016年,AtomNet提交了一份arxiv论文,该公司开发了一种DNN模型来分类停靠在蛋白质结合口袋中的小分子的活性[87]。值得注意的是,AtomNet DNN模型能够达到0.7到0.9之间的AUC指标,具体取决于所使用的测试集,它明显优于传统的对接方法,特别是Smina,[88] AutoDock Vina [89]分叉0.1到0.2。 [87]关于与计算生物学更紧密结合的应用中的深度学习的其他近期发展,我们向读者推荐以下关于该研究课题的评论。[90]

    计算结构生物学

    当蛋白质序列折叠成其三维结构时,预测蛋白质序列的任何两个残基的空间接近性称为蛋白质接触预测。对顺序不同残基之间接触的预测因此对其3D结构施加强约束,使其对从头蛋白质结构预测或工程特别有用。虽然使用基于物理学的模拟方法,如长时间尺度分子动力学[91,92]可用于从头算蛋白质结构预测,但计算需求是艰巨的。 Wolynes,Onuchic等人开发的互补方法,如基于知识的物理方法也是一种选择[93,94],虽然它们的计算成本较低,但仍然要求足够高,以至于不能用于大规模研究。因此,机器学习方法是可行的替代方案,包括基于人工神经网络,[95-97] SVM,[27]和隐马尔可夫模型[98]的方法。其他方法包括基于模板的方法,这些方法使用同源性或线程方法来识别结构相似的模板,以推断蛋白质接触预测。[99,100]接触预测因子的这些不同模型的评估是蛋白质关键评估的亮点之一结构预测(CASP)的挑战始于1996年。尽管多年来有所改进,但远程接触预测历史上已经达到了精确度低于30%的玻璃上限。计算蛋白质结构预测的关键历史发展是大量的,我们引用感兴趣的读者对这个主题的现有评论。[101-104]为了这次审查的目的,我们将讨论范围限制在最近的DNN-基于模型的模型,以及它们如何对突破玻璃天花板的历史预期至关重要。
    2012年,Baldi和同事们开发了多阶段机器学习方法CMAPpro,将接触预测的准确性提高到36%[105]。 CMAPpro在早期模型中实现了三项具体的改进。首先是使用二维递归神经网络来预测二级结构元素之间的粗糙接触和取向。此外,一种新型的基于能量的神经网络方法被用来改进来自第一网络的预测,并用于预测残留物接触概率。最后,DNN架构被用来通过整合空间和时间信息来调整所有残差 - 接触概率的预测。 CMAPpro接受了来自ASTRAL数据库的2356个成员训练集的训练。为了交叉验证的目的,该组被分割成属于不同SCOP折叠的10个不相交的组,这意味着无论是训练还是验证都设置共享序列或结构相似性。然后对所产生的模型性能进行测试,对照在ASTRAL数据库版本1.73和1.75之间报告的364个成员的新蛋白质折叠测试集。将CMAPpro性能与多级机器学习模型的几种排列进行比较,包括单隐层神经网络(NN),单隐层神经网络,其利用由2D递归神经生成的粗接触/定向和对准预测器网络和基于能量的神经网络(NN1CA)以及深度神经网络,但没有CA特征(DNN)。基于相对性能,深度网络架构和CA特性都需要达到36%的准确度; DNN和NN1CA各占32%,而代表先前技术水平的NN仅达到26%的精度。

    Eickholt和Cheng在2012年也报道了DNN用于蛋白质接触预测的不同实施。[107]在他们的算法DNCON中,它将深度学习与用于开发集合预测器的提升技术相结合。使用来自蛋白质数据库的1426个成员数据集来训练DNCON,训练(1230个成员)和确认(196个成员)组之间随机分配。显式设计的特征被用作DNN的输入。具体而言,使用了三类特征:(i)来自以所讨论的残基对为中心的两个窗口的特征(例如,预测的二级结构和溶剂可及性,来自PSSM的信息和可能性以及Acthley因子等),(ii) )成对特征(例如Levitt的接触电位,Jernigan的配对潜能等)和(iii)全局特征(例如,蛋白质长度,预测的暴露的α螺旋和β片层残基的百分比等)。使用这些工程功能,DNN模型的任务是预测是否有特定的残基对接触。此外,分类器的增强集合是通过使用从训练集中获得的较大池中的90,000个长程残留 - 残留对的样本训练几个不同的DNN而创建的。在评估其性能时,DNCON的交叉验证准确率为34.1%。该模型的性能可转移性在其性能基准中与CASP9,[108] ProC_S3,[28]和SVMcon [27]中两个分别基于RF和SVM算法的最佳预测指标进行了对比。在该评估中,每个软件都使用了相应的测试集。虽然改进不如Baldi及其同事报道的那么戏剧化,但DNCON的性能比当时最先进的算法好3%; ProC_S3(32.6%比29.7%)和SVMcon(32.9%比28.5%)。

    基于DNN的蛋白质接触预测模型值得注意,因为它使社区能够突破前几年不可能实现的30%的准确性障碍。除蛋白质接触预测外,DNNs也已成功应用于仅从序列数据预测各种蛋白质角度,二面角和二级结构。使用DNNs,Zhou,Yang和同事发表了一系列基于序列的钙基角度和扭转预测[109-111]。与蛋白质接触预测不同,骨干扭转可以更好地限制从头蛋白质结构预测和其他建模目的。[112]在这些基于DNN的模型的开发中,Zhou,Yang及其合作者使用了4590个成员的训练集和从蛋白质序列剔除服务器PISCES获得的1199个独立测试集[113]。输入数据特别包括从PSI-BLAST产生的位置特异性评分矩阵[114,115]获得的工程特征以及与残基特性有关的几个其他物理化学特性,包括空间特性,疏水性,体积,极化率,等电点,螺旋概率等。[116]

    在SPINE-X算法的开发中,使用DNN直接预测二级结构,残余溶剂可接近表面积(ASA)和u和扭转角[110]。开发了一个六步机器学习体系结构,其中ASA等输出被用作其他要预测的属性(如扭转)的后续输入。基于模型在独立测试集上的性能评估,它分别获得了u和w两面体的平均绝对误差228和338。独立数据集的二级结构预测精度范围为81.3%至82.3%,考虑到序列数据的二级结构预测领域近十年来停滞在近80%的准确度范围内,这一成就值得注意,其中一些利用传统机器学习算法。[117]以类似的方式,对于稍后开发的SPIDER算法,DNN被用于直接预测Ca角(h)和扭转(s)。根据对模型性能的评估,它分别获得了h和s的平均绝对误差98和348,作者观察到该模型的误差从螺旋残留物增加到片残留物到残余物,随后出现非结构化趋势。使用这些预测的角度和扭转作为限制,作者能够在预测结构和天然结构之间对蛋白质的三维结构进行建模,平均RMSD为1.9A。随后,SPINE-X和SPIDER算法作为并行多步算法重新训练,同时预测以下性质:二级结构,ASA,u,w,h和s。这导致二级结构整体精度略有提高2%,并且角度/扭矩MAE减少1-38,同时保持相同的ASA性能水平。

    除了蛋白质结构建模之外,深度学习也被用来根据序列数据预测其他感兴趣的特性。例如,最近报道预测DNA和RNA结合蛋白的序列特异性[118,119]。在Frey及其合作者的开创性研究中[118],DeepBind算法用于预测DNA和RNA结合蛋白的序列特异性。使用12TB的序列数据,跨越数千个公共PBM,RNAcompete,ChIP-seq和HT-SELEX实验,将原始数据用作DNN算法的输入以计算预测结合分数。 DeepBind表征DNA结合蛋白特异性的能力在来自Weirauch等人修订的DREAM5 TFDNA基序识别挑战的PBM数据中得到证实[120]值得注意的是,DeepBind基于Pearson相关性和AUC指标优于所有现有的26种算法,并在DREAM5提交的15个小组中排名第一。有趣的是,他们的结果还表明,体外数据训练的模型在体内评分数据中运行良好,表明DNN已经捕获了核酸结合本身的一部分性质。

    随着在其他领域重复出现深度学习优于传统机器学习算法[18,32-35]以及计算机辅助药物设计本身[62,67,69],DNN在推动“玻璃”天花板“蛋白质接触预测和二级结构预测的界限应该不令人意外。本次审查中显然缺乏的是深度学习在RNA结构预测和建模中的应用,据我们所知尽管尚未报道。与蛋白质数据库相比,RNA上的可用结构数据更小。此外,大多数RNA结构数据不是结晶学的,而是基于核磁共振的,由于NMR结构本身是用基于物理学的力场对抗实验有界的约束来近似解决的事实,其自身受到较高的不确定性[121]。尽管如此,研究深度学习如何使RNA建模社区受益将会很有趣。

    最后,与计算机辅助药物设计相比,在计算结构生物学应用中使用深度学习的一个有趣的对比是对工程特征的独占使用,并且在一些情况下,多级机器学习算法本身的体系结构的工程设计。 虽然计算机辅助药物设计领域的发现是初步的,但有一些迹象表明,明确设计的特征不一定能更好地对抗化学指纹,这可能需要较少的化学领域知识来构建。 尽管我们承认蛋白质比小分子复杂得多,但确定使用仅包含基本结构和连接性信息的输入数据的DNN模型的性能(没有任何特别设计的特征)是否能够准确预测诸如 蛋白质二级结构和远距离接触。

    量子化学

    使用机器学习补充或取代传统的量子力学(QM)计算已在过去几年出现。在本节中,我们将研究一些机器学习应用到量子化学,并检查类似的基于DNN的模型的相对性能。 2012年,von Lilienfeld和同事开发了一种基于非线性统计回归的机器学习算法,以预测有机分子的雾化能量[29]。该模型使用分子生成数据库(GDB)的7000个成员子集,该数据库是109个稳定且可合成处理的有机化合物库。用于训练的目标数据是使用PBE0杂种功能计算的7000种化合物的原子化能。没有明确的分子描述符被用作输入数据,相反,只有笛卡尔坐标和核电荷用于“库仑”矩阵表示。可以说,没有明确设计的特征,输入数据中的这种表示与传统分子建模方法中使用的分子指纹所提供的表达水平相同。 von Lilienfeld及其同事使用的化合物只有1000种,平均绝对误差(MAE)准确度为14.9 kcal / mol。进一步的外部6000化合物验证组测试产生了15.3 kcal / mol的相似准确度,证明了该模型在“同类”化合物中的可转移性。这项工作特别具有开创性意义的是合理概括QM计算能量的能力,平均绝对误差为15千卡/摩尔,根本没有在机器学习算法中实现薛定谔方程。更重要的是,考虑到这项工作使用了缺乏DNN优势的传统机器学习算法,并且基于DNN的历史性能,这表明基于DNN的模型应该表现得更好。

    Hansen等人随后的出版物研究了许多已建立的机器学习算法,以及分子表征对von Lilienfeld工作中使用的相同数据集上原子化能量预测性能的影响[122]。主要研究结果之一是使用“库仑矩阵”的随机变体大大提高了雾化能量的准确度,以实现低至3.0千卡/摩尔的MAE。[122]除了作为分子的逆原子 - 距离矩阵表示之外,随机变体是独特的并且保持关于分子翻译和旋转的不变性。这种改进的表示增加了“副作用”,因为它是高维度的并且考虑到原子的多重索引,所以它是最富有的发展。作者发现,在所有测试的机器学习算法中,通过信息对各种表示进行排序确实会产生相应较低的准确性[122],这强调了QM应用程序中良好数据表示的重要性。公平地说,还应该指出的是,作者确实对人工神经网络进行了基准测试,虽然它们的MAE为3.5kcal / mol,但表现出令人满意的效果,但并没有比非线性回归法的3.0kcal / mol MAE好得多。尽管如此,我们强调所用的神经网络“浅”,有几层,再加上缺少更大的数据集,并不代表真正的DNN实现。本文的一个特别有启发性的猜想是通过外推性能(MAE误差)相对于所使用的数据集的大小,作者得出结论,3千卡/摩尔可能是无论机器学习如何可以实现的“基线”误差算法。[122]

    2013年,冯·利林菲尔德报道了第一个多任务DNN模型的应用,该模型不仅可以预测原子化能,还可以预测其他几种电子基态和激发态性质。在这项工作中,他们试图利用多任务学习的优势,通过预测几种电子属性并潜在地捕捉看似无关的属性和理论水平之间的相关性。数据用“库伦矩阵”的随机变量表示。[122]目标数据是使用几种不同的理论水平计算的原子化能量,静态极化率,前沿轨道特征值HOMO和LUMO,电离势和电子亲和力,例如PBE0,ZINDO,GW和SCS。原子化能量保持了0.16eV(〜3.6kcal / mol)的相似MAE精度,并且对于其他能量预测(包括HOMO,LUMO,以及其他)的MAE的准确度为0.11至0.17eV(≥2.5至3.9kcal / mol)电离电位和电子亲和力[123]。此外,这种精确度与用于构建训练集的质量管理计算中使用的相应理论水平的误差相似。

    虽然使用机器学习算法替代QM计算是诱人的,但另一种更“第一原理基础”的方法是使用机器学习算法来补充现有的QM算法。正如von Lilienfeld及其同事在2015年首次报道的那样,他们展示了Dlearning方法,即机器学习“修正术语”被开发出来。在该研究中,作者使用DFT计算的特性,并能够使用D学习校正项预测G4MP2理论水平的相应数量。这种复合式QM / ML方法结合了近似而快速的传统QM近似与现代大数据量化的质量管理估算,这些估算在化学空间上进行了昂贵且准确的结果培训。但是,我们注意到,这种方法迄今仅用传统的机器学习算法进行了演示。如果使用我们在众多实例中观察到的多任务DNN进行性能提升适用于此示例,则基于DNN的方法可能会产生出色的结果,但尚未在文献中报告。
    据我们所知,量子化学应用中DNN的例子似乎表明,与计算机辅助药物设计和计算结构生物学相比,它处于发展的早期阶段。 从文献中,我们知道传统的机器学习模型已经用于其他质量管理应用,例如建模电子量子传输,用于精确半经验量子化学计算的学习参数[126]等等。 另外,QM应用的新表示和指纹也正在开发中[127,128]。鉴于基于DNN的模型在其他计算化学领域的传统机器学习模型中观察到的高精度,我们建议开发基于DNN的模型 机器学习QM应用的例子对该领域有利。

    计算材料设计

    量子化学领域的DNN应用的逻辑扩展是预测和设计与QM计算的特性相关或基于QM计算的特性的材料特性。定量结构特性关系(QSPR),是QSAR在非生物领域的类似版本,是预测物理性质的科学,其从更基本的物理化学特性出发,在之前的出版物中得到了广泛的综述。[129,130 ]与现代药物开发早期相似,物质发现主要是由偶然性和机构记忆驱动的[131]。这使得该领域成为探索性的试验方法,而分子材料设计的关键瓶颈在于实验的合成和表征。近年来,计算和合理材料设计的范例已被封装在材料基因组计划下[132,133]。由于这一领域的新颖性,在本节中,我们将研究使用计算材料的机器学习的一些关键成就设计并突出深度学习应用场景。

    Raccuglia等人发表了一篇最近使用机器学习模型加速材料性能研究的高调例子。在2016年。[30]无机 - 有机杂化材料如金属有机骨架(MOFs)的合成已经被广泛研究了数十年,但对这些化合物形成的理论理解仅部分被理解。在Raccuglia等人的工作中,作者使用基于SVM的模型来预测模板化钒亚硒酸盐结晶的反应结果。关于他们的工作有趣的是,在训练模型时纳入了“黑暗”反应,这些反应是从存档的实验室笔记本收集的失败或不成功的反应。由目标化合物类型的合成所定义的,所得模型具有89%的成功率。值得注意的是,这超过了78%的人类直觉成功率[131]。虽然在本研究中没有使用基于DNN的模型,但没有技术上的原因说明它不能用来代替SVM作为用于计算材料合成预测的工具。

    2015年,Aspuru-Gizik及其同事报告了DNN如何用于加速材料发现的一个例子。[134]在这里,作者使用从哈佛清洁能源项目获得的数据集 - 高通量虚拟筛选工作,发现高性能有机光伏材料。要预测的度量是功率转换效率(PCE),其是HOMO和LUMO能量以及几个其他经验参数的函数。[134]由于没有高质量的三维数据可用于生成库仑矩阵,作者决定使用基于分子图的指纹作为输入表示。测试了四种不同的表示,结果显示HOMO,LUMO和PCE预测的准确性一致(在同一数量级内)。该数据集由从CEPDB数据库中随机选择的200,000种化合物组成,另有50,000种被提取作为测试集。 HOMO和LUMO的测试误差分别为0.15和0.12eV,这与von Lilienfeld及其同事开发的DNN模型相当。

    虽然材料设计中的DNN应用仍处于起步阶段,但看看它的应用如何应对传统QSPR应用和即将进行的合理材料设计工作(如预测荧光团的光谱特性[135,136]、离子液体的特性[137]、和纳米结构的活性[138]))将会很有趣。

    关于深度学习和黑盒子特性的保守看法

    机器学习算法虽然可能不是我们领域许多从业人员首选的工具,但无可否认在化学信息学领域以及QSAR和蛋白质结构预测等应用领域有着丰富的历史。虽然有人可能认为深度学习在某种意义上是以前的人工神经网络的复兴,但过去十年的算法和技术突破使得开发出惊人复杂的深度神经网络,允许训练具有数亿权重。加上数据和GPU加速科学计算的发展,深度学习推翻了计算机科学领域的许多应用,如语音识别和计算机视觉。鉴于化学领域中类似的相似之处,这表明深度学习可能是一个有价值的工具,可以添加到计算化学工具箱中。正如表1所总结的那样,它提出了基于DNN模型的关键初步出版物,我们注意到深度学习在计算化学许多子领域的广泛应用。此外,基于DNN的模型的性能几乎总是等同于现有的最先进的非神经网络模型,并且有时提供了优异的性能。然而,我们注意到,如果要比较DNN为其语音识别和计算机视觉的“母体”领域带来的改进,许多情况下的性能提升并不显着。解释化学领域缺乏革命性进展的一个缓解因素可能是数据的相对稀缺性。与数据便宜的计算机科学领域不同,尤其是从互联网或社交媒体获得的数据时,由于需要进行实际的实验或计算以生成有用的数据,所以化学中可用数据的数量可以理解为更小且更昂贵。此外,化学领域已经存在了几个世纪,并且考虑到化学原理基于物理定律的事实,例如分子描述符等特征的发展来解释化合物溶解度是不难想象的,例如,比开发功能来解释狗和猫之间的差异更容易,这是计算机视觉中的一项常见任务。因此,在化学中具有更精确和更好的工程特征,我们也可能看不到如此大的初始性能改进,尤其是对于相对简单的化学原理或概念。

    此外,作为计算化学家,与工程师或技术人员相比,更重视概念理解,这可以说是计算机科学领域中比较流行的思维模式。 在这方面,深度学习算法目前在两个账户上不足。 首先,它缺乏基于实际物理定律的第一原理模型的概念优雅,第二,DNN本质上是一个黑盒子; 很难理解神经网络“已经学会”什么,或者它究竟如何预测感兴趣的属性。
    这里写图片描述
    为了解决概念优雅的第一个问题,从某种角度来看,这种反对可能更多地是科学偏好的哲学论证。在大多数计算化学应用中,除非人们精确地求解薛定谔方程,我们知道除了双体系统外其他方法都不可能,我们必须对模型进行近似。从这个意义上说,几乎所有的计算化学都是凭经验确定的,有时甚至直观地确定了薛定谔方程的“真实”第一性原理的近似值。为了说明这一点,让我们来看看古典分子模型力场的历史发展,如CHARMM [42]和AMBER。[43]例如,二面角力常数的参数化在历史上一直针对QM计算值,即以经验证的物理原理为基础的“真实”值。然而,由于真实分子的动力学行为不具有叠加作用(这本身就是经典分子模型的另一种近似),最近的重新参数化已经开始修改二面角参数,以经验拟合实验NMR分布,尽管这可能导致偏差[142,143]同样,模拟静电力的伦琴相互作用的选择也只是近似正确的,模型带电离子相互作用的最近参数开始已经开始拟合各种实验观察值,例如渗透压值,以及在建模特定的静电相互作用对时引入非物理修正项[144-146]在这些例子中,必须从第一原理进行逼近,而这个过程是一个基于经验数据或有时“化学直觉“ - 就像Raccuglia等人。已经表明,不是绝对可靠的,并不总是更准确。[131]在计算化学家所做的工作过于简单化的风险下,现有计算化学模型的发展可能被视为一种精细的曲线拟合练习。与其使用人类专家知识,可能的替代方案可能是使用深度学习算法来“建议”,或者甚至可能帮助我们“决定”应该做出什么样的近似以达到期望的结果,以朝着未来的范式转变基于DNN的人工智能(AI)辅助化学研究。这自然会导致深层学习的第二个缺点 - 不可避免的问题 - 我们如何知道深度学习模型正在学习正确的物理或化学?

    我们会承认,在目前的实施中,深度学习算法仍然是一个黑匣子,并且询问它“学习”的内容是一项极具挑战性的任务。尽管如此,诸如SVM和RF之类的黑盒算法也被用于几种计算化学应用中,特别是在主要用作工具的示例中,和/或用于预测如此复杂的属性,以至于即使对于问题不一定有助于其预测。我们承认,要推动深入学习不仅仅是化学家工具包中的另一个工具,并且为了获得更广泛的适用性和科学研究的采用,显然DNN的可解释性的提高是最重要的。虽然神经网络的可解释性历来不是这一领域的从业人员强烈的研究焦点,但值得注意的是,近期有关提高可解释性的一些发展已有报道[147,148]。其他可行的选择包括使用不同的基于神经网络的机器学习模型,如为解释性而设计的影响相关性选民(IVR)。正如Baldi及其同事所做的一些计算化学应用所证明的,IRV是一种低参数神经网络,通过非线性地结合化学邻居在训练集中的影响来改进k-最近邻分类器。 IRV影响也被非线性地分解为相关成分和投票成分。因此,IRV的预测本质上是透明的,因为通过检查每个预测的影响可以从网络中提取用于进行预测的确切数据,使其更接近“白盒”神经网络方法[149,150]

    结论

    与目前计算化学中使用的传统机器学习算法不同,深度学习在其使用非线性函数的层次级联中有所区别。这使得它可以学习表示并从预测理想的物理化学性质所需的原始未处理数据中提取出必要的特征。正是这一特点使得深度学习在其语音识别和计算机视觉的“母体”领域中产生了重大影响和变革性影响。在计算化学中,其影响更近,更具初步性。尽管如此,根据近期一些研究的结果,我们注意到深度学习在许多计算化学领域的广泛应用,包括计算机辅助药物设计,计算结构生物学,量子化学和材料设计。在我们所研究的几乎所有应用中,基于DNN的模型的性能常常优于传统的机器学习算法。

    随着问题复杂性的增加,能够应用多任务学习(即需要更多的不同属性的预测),随着数据集大小的增加,我们也看到了深入的学习从经常表现出色到始终优于传统机器学习模型。此外,一些初步研究结果表明,诸如分子描述符等明确设计的特征可能不需要构建高性能DNN模型,并且以分子指纹或库仑矩阵形式的简单表示可能就足够了。这是因为DNN能够通过隐藏层提取出自己的特征。甚至有迹象表明DNN“学习”的特征符合实际的化学概念,如毒素。加上最近关于提高神经网络可解释性的研究,它表明DNN在计算化学中的未来作用可能不仅仅是一种高性能的预测工具,而且可能也是一种假设生成装置。


    参考文献

    [1] D. Silver, A. Huang, C. J. Maddison, A. Guez, L. Sifre, G. van den
    Driessche, J. Schrittwieser, I. Antonoglou, V. Panneershelvam, M.
    Lanctot, S. Dieleman, D. Grewe, J. Nham, N. Kalchbrenner, I. Sutskever,
    T. Lillicrap, M. Leach, K. Kavukcuoglu, T. Graepel, D. Hassabis, Nature
    2016, 529, 484
    [2] M. Campbell, A. J. Hoane, F. H. Hsu, Artif. Intell. 2002, 134, 57
    [3] J. L. Reymond, M. Awale, ACS Chem. Neurosci. 2012, 3 ,649
    [4] R. S. Bohacek, C. McMartin, W. C. Guida, Med. Res. Rev. 1996, 16, 3
    [5] H. D. Li, Y. Z. Liang, Q. S. Xu, Chemometr. Intell. Lab. 2009, 95, 188
    [6] G. Hautier, C. C. Fischer, A. Jain, T. Mueller, G. Ceder,Chem. Mater.
    2010, 22, 3762.
    [7] K. R. Muller, G. Ratsch, S. Sonnenburg, S. Mika, M. Grimm, N. Heinrich,
    J. Chem. Inf. Model. 2005, 45, 249
    [8] A. P. Bartok,M. J. Gillan, F. R. Manby, G. Csanyi, Phys. Rev. B 2013, 88,
    054104.
    [9] NIH, Available at: https://ncats.nih.gov/news/releases/2015/tox21-challenge-
    2014-winners
    [10] M. Raghu, B. Poole, J. Kleinberg, S. Ganguli, J. Sohl-Dickstein,
    arXiv:1606.05336, 2016.
    [11] A. E. Bryson, W. F. Denham, S. E. Dreyfus, AIAA J. 1963, 1, 2544
    [12] D. E. Rumelhart, G. E. Hinton, R. J. Williams, Nature 1986, 323, 533
    [13] S. Hochreiter, Y. Bengio, P. Frasconi, J. Schmidhuber, Gradient Flow in
    Recurrent Nets: the Difficulty of Learning Long-term Dependencies. In
    A Field Guide to Dynamical Recurrent Neural Networks; S. C. Kremer,
    J. F. Kolen, Eds.; 2001.
    [14] G. E. Hinton, S. Osindero, Y. W. Teh, Neural Comput. 2006, 18, 1527
    [15] X. Glorot, A. Bordes, Y. Bengio, In Proc. 14th International Conference
    on Artificial Intelligence and Statistics 315–323 (2011).
    [16] N. Srivastava, G. Hinton, A. Krizhevsky, I. Sutskever, R. Salakhutdinov, J.
    Mach. Learn Res. 2014, 15, 1929.
    [17] Y. LeCun, Y. Bengio, G. Hinton, Nature 2015, 521, 436.
    [18] A. Krizhevsky, I. Sutskever, G. E. Hinton, In Advances in Neural Information
    Processing Systems (NIPS), 2012, pp. 1106–1114.
    [19] W. Xiong, J. Droppo, X. Huang, F. Seide, M. Seltzer, A. Stolcke, D. Yu, G.
    Zweig, arXiv:1610.05256, 2016.
    [20] Y. Wu, et al. arXiv:1609.08144, 2016.
    [21] Y. Bengio, A. Courville, P. Vincent, IEEE Trans. Pattern Anal. Mach. Intell.
    2013, 35, 1798.
    [22] J. Schmidhuber, Neural Netw. 2015, 61, 85.
    [23] I. Arel, D. C. Rose, T. P. Karnowski, IEEE Comput. Intell. M. 2010, 5, 13.
    [24] E. Gawehn, J. A. Hiss, G. Schneider, Mol. Inf. 2016, 35, 3.
    [25] W. S. Mcculloch, W. Pitts, B Math. Biol. 1990, 5,2, 99
    [26] V. Svetnik, A. Liaw, C. Tong, J. C. Culberson, R. P. Sheridan, B. P.
    Feuston, J. Chem. Inf. Comput. Sci. 2003, 43, 1947.
    [27] J. Cheng, P. Baldi, BMC Bioinform. 2007, 8. 113.
    [28] Y. Q. Li, Y. P. Fang, J. W. Fang, Bioinformatics 2011, 27, 3379.
    [29] M. Rupp, A. Tkatchenko, K. R. Muller, O. A. von Lilienfeld, Phys. Rev.
    Lett, 2012, 108, 058301.
    [30] P. Raccuglia, K. C. Elbert, P. D. Adler, C. Falk, M. B. Wenny, A. Mollo, M.
    Zeller, S. A. Friedler, J. Schrier, A. J. Norquist, Nature 2016, 533, 73.
    [31] H. Y. Du, J. Wang, Z. D. Hu, X. J. Yao, X. Y. Zhang, J. Agric. Food Chem.
    2008, 56, 10785.
    [32] A. Graves, J. Schmidhuber, Neural Netw. 2005, 18, 602.
    [33] K. He, X. Zhang, S. Ren, J. Sun, arXiv:1502.01852, 2015.
    [34] S. Ioffe, C. Szegedy, arXiv:1502.03167, 2015.
    [35] C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan,
    V. Vanhoucke, A. Rabinovich, arXiv:1409.4842, 2014.
    [36] O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh, S. Ma, Z. Huang,
    A. Karpathy, A. Khosla, M. Bernstein, A. C. Berg, L. Fei-Fei, Int. J. Comput.
    Vis. 2015, 115, 211.
    [37] O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh, S. Ma, Z. Huang, A.
    Karpathy, A. Khosla, M. Bernstein, A. C. Berg, L. Fei-Fei, arXiv:1409.0575,
    2015.
    [38] P. Baldi, P. Sadowski, D. Whiteson, Nat. Commun. 2014, 5, 4308
    [39] D. Chicco, P. Sadowski, P. Baldi, In Proceedings of the 5th ACM Conference
    on Bioinformatics Computational Biology, and Health Informatics,
    2014; p. 533.
    [40] J. E. Stone, J. C. Phillips, P. L. Freddolino, D. J. Hardy, L. G. Trabuco, K.
    Schulten, J. Comput. Chem. 2007, 28, 2618.
    [41] K. Yasuda, J. Chem. Theory Comput. 2008, 4, 1230.
    [42] B. R. Brooks, C. L. Brooks, A. D. Mackerell, L. Nilsson, R. J. Petrella, B.
    Roux, Y. Won, G. Archontis, C. Bartels, S. Boresch, A. Caflisch, L. Caves,
    Q. Cui, A. R. Dinner, M. Feig, S. Fischer, J. Gao, M. Hodoscek, W. Im, K.
    Kuczera, T. Lazaridis, J. Ma, V. Ovchinnikov, E. Paci, R. W. Pastor, C. B.
    Post, J. Z. Pu, M. Schaefer, B. Tidor, R. M. Venable, H. L. Woodcock, X.
    Wu, W. Yang, D. M. York, M. Karplus, J. Comput. Chem. 2009, 30, 1545.
    [43] D. A. Case, T. E. Cheatham, T. Darden, H. Gohlke, R. Luo, K. M. Merz, A.
    Onufriev, C. Simmerling, B. Wang, R. J. Woods, J. Comput. Chem. 2005,
    26, 1668.
    [44] J. C. Phillips, R. Braun, W. Wang, J. Gumbart, E. Tajkhorshid, E. Villa, C.
    Chipot, R. D. Skeel, L. Kale, K. Schulten, J. Comput. Chem. 2005, 26, 1781.
    [45] B. Hess, C. Kutzner, D. van der Spoel, E. Lindahl, J. Chem. Theory Comput.
    2008, 4, 435.
    [46] M. Valiev, E. J. Bylaska, N. Govind, K. Kowalski, T. P. Straatsma, H. J. J.
    Van Dam, D. Wang, J. Nieplocha, E. Apra, T. L. Windus, W. de Jong,
    Comput. Phys. Commun. 2010, 181, 1477.
    [47] Y. Shao, L. F. Molnar, Y. Jung, J. Kussmann, C. Ochsenfeld, S. T. Brown, A.
    T. B. Gilbert, L. V. Slipchenko, S. V. Levchenko, D. P. O’Neill, R. A.
    DiStasio, R. C. Lochan, T. Wang, G. J. O. Beran, N. A. Besley, J. M.
    Herbert, C. Y. Lin, T. Van Voorhis, S. H. Chien, A. Sodt, R. P. Steele, V. A.
    Rassolov, P. E. Maslen, P. P. Korambath, R. D. Adamson, B. Austin, J.
    Baker, E. F. C. Byrd, H. Dachsel, R. J. Doerksen, A, Dreuw, B. D. Dunietz,
    A. D. Dutoi, T. R. Furlani, S. R. Gwaltney, A. Heyden, S. Hirata, C. P. Hsu,
    G. Kedziora, R. Z. Khalliulin, P. Klunzinger, A. M. Lee, M. S. Lee, W. Liang,
    I. Lotan, N. Nair, B. Peters, E. I. Proynov, P. A. Pieniazek, Y. M. Rhee, J.
    Ritchie, E. Rosta, C. D. Sherrill, A. C. Simmonett, J. E. Subotnik, H. L.
    Woodcock, W. Zhang, A. T. Bell, A. K. Chakraborty, D. M. Chipman, F. J.
    Keil, A. Warshel, W. J. Hehre, H. F. Schaefer, J. Kong, A. I. Krylov, P. M. W.
    Gill, M. Head-Gordon, Phys. Chem. Chem. Phys. 2006, 8, 3172.
    [48] M. W. Schmidt, K. K. Baldridge, J. A. Boatz, S. T. Elbert, M. S. Gordon, J.
    H. Jensen, S. Koseki, N. Matsunaga, K. A. Nguyen, S. J. Su, T. L. Windus,
    M. Dupuis, J. A. Montgomery, J. Comput. Chem. 1993, 14, 1347.
    [49] R. Collobert, K. Kavukcuoglu, C. Farabet, In Proceedings of the NIPS
    BigLearn Workshop, 2011.
    [50] R. Al-Rfou, et al. arXiv:1605.02688, 2016.
    [51] Y. Jia, E. Shelhamer, J. Donahue, S. Karayev, J. Long, R. Girshick, S.
    Guadarrama, T. Darrell, arXiv:1408.5093, 2014.
    [52] M. Abadi, et al. arXiv:1605.08695, 2016.
    [53] W. W. Soon, M. Hariharan, M. P. Snyder, Mol. Syst. Biol. 2013, 9, 640.
    [54] W. P. Ajay Walters, M. A. Murcko, J. Med. Chem. 1998, 41, 3314.
    [55] F. R. Burden, D. A. Winkler, J. Med. Chem. 1999, 42, 3183.
    [56] F. R. Burden, M. G. Ford, D. C. Whitley, D. A. Winkler, J. Chem. Inf. Comput.
    Sci. 2000, 40, 1423.
    [57] M. Karelson, V. S. Lobanov, A. R. Katritzky, Chem. Rev. 1996, 96, 1027.
    [58] P. Gramatica, QSAR Comb. Sci. 2007, 26, 694.
    [59] J. Verma, V. M. Khedkar, E. C. Coutinho, Curr. Top. Med. Chem. 2010,
    10, 95.
    [60] A. Tropsha, Mol. Inf. 2010, 29, 476.
    [61] Kaggle, Available at: http://blog.kaggle.com/2012/11/01/deep-learninghow-
    i-did-it-merck-1st-place-interview/
    [62] G. E. Dahl, N. Jaitly, R. Salakhutdinov, arXiv:1406.1231, 2014.
    [63] A. Mauri, V. Consonni, M. Pavan, R. Todeschini, Match-Commun. Math.
    Co. 2006, 56, 237.
    [64] D. A. Winkler, J. Phys. Chem. Lett. 200, 23, 73.
    [65] J. Ma, R. P. Sheridan, A. Liaw, G. E. Dahl, V. Svetnik, J. Chem. Inf. Model.
    2015, 55, 263.
    [66] D. Lowe, Available at: http://blogs.sciencemag.org/pipeline/archives/
    2012/12/11/did_kaggle_predict_drug_candidate_activities_or_not
    [67] T. Unterthiner, A. Mayr, G. Klambauer, M. Steijaert, H. Ceulemans, J.
    Wegner, S. Hochreiter, In NIPS Workshop on Deep Learning and Representation
    Learning (Montreal, QC), 2014.
    [68] D. Rogers, M. Hahn, J. Chem. Inf. Model. 2010, 50, 742.
    [69] B. Ramsundar, S. Kearnes, P. Riley, D. Webster, D. Konerding, V. Pande,
    arXiv:1502.02072, 2015.
    [70] Y. Wang, J. Xiao, T. O. Suzek, J. Zhang, J. Wang, Z. Zhou, L. Han, K.
    Karapetyan, S. Dracheva, B. A. Shoemaker, E. Bolton, A. Gindulyte, S. H.
    Bryant, Nucleic Acids Res. 2012, 40, D400.
    [71] S. G. Rohrer, K. Baumann, J. Chem. Inf. Model. 2009, 49, 169.
    [72] M. M. Mysinger, M. Carchia, J. J. Irwin, B. K. Shoichet, J. Med. Chem.
    2012, 55, 6582.
    [73] R. Huang, S. Sakamuru, M. T. Martin, D. M. Reif, R. S. Judson, K. A.
    Houck, W. Casey, J. H. Hsieh, K. R. Shockley, P. Ceger, J. Fostel, K. L.
    Witt, W. Tong, D. M. Rotroff, T. Zhao, P. Shinn, A. Simeonov, D. J. Dix,
    C. P. Austin, R. J. Kavlock, R. R. Tice, M. Xia, Sci. Rep. 2014, 4, 5664.
    [74] D. N. Assis, V. J. Navarro, Expert Opin. Drug. Metab. Toxicol. 2009, 5, 463.
    [75] Y. Xu, Z. Dai, F. Chen, S. Gao, J. Pei, L. Lai, J. Chem. Inf. Model. 2015,
    55, 2085.
    [76] H. Hong, Q. Xie, W. Ge, F. Qian, H. Fang, L. Shi, Z. Su, R. Perkins, W.
    Tong, J. Chem. Inf. Model. 2008, 48, 1337.
    [77] C. W. Yap, J. Comput. Chem. 2011, 32, 1466.
    [78] A. Lusci, G. Pollastri, P. Baldi, J. Chem. Inf. Model. 2013, 53, 1563.
    [79] T. B. Hughes, G. P. Miller, S. J. Swamidass, ACS Cent. Sci. 2015, 1, 168.
    [80] J. Zaretzki, M. Matlock, S. J. Swamidass, J. Chem. Inf. Model. 2013, 53,
    3373.
    [81] J. Zaretzki, K. M. Boehm, S. J. Swamidass, J. Chem. Inf. Model. 2015, 55,
    972.
    [82] N. L. Dang, T. B. Hughes, V. Krishnamurthy, S. J. Swamidass, Bioinformatics
    2016, 32, 3183.
    [83] T. B. Hughes, G. P. Miller, S. J. Swamidass, Chem. Res. Toxicol. 2015, 28, 797.
    [84] T. B. Hughes, N. L. Dang, G. P. Miller, S. J. Swamidass, ACS Cent. Sci.
    2016, 2, 529.
    [85] A. Mayr, G. Klambauer, T. Unterthiner, S. Hochreiter, Front. Env. Sci.
    2016, 3, 1.
    [86] S. Kearnes, B. Goldman, V. Pande, arXiv:1606.08793, 2016.
    [87] I. Wallach, M. Dzamba, A. Heifets, arXiv:1510.02855, 2016.
    [88] D. R. Koes, M. P. Baumgartner, C. J. Camacho, J. Chem. Inf. Model.
    2013, 53, 1893.
    [89] O. Trott, A. J. Olson, J. Comput. Chem. 2010, 31, 455.
    [90] P. Mamoshina, A. Vieira, E. Putin, A. Zhavoronkov, Mol. Pharm. 2016,
    13, 1445.
    [91] D. E. Shaw, R. O. Dror, J. K. Salmon, J. P. Grossman, K. M. Mackenzie, J.
    A. Bank, C. Young, M. M. Deneroff, B. Batson, K. J. Bowers, E. Chow, M.
    P. Eastwood, D. Ierardi, J. L. Klepeis, J. S. Kuskin, R. H. Larson, K.
    Lindorff-Larsen, P. Maragakis, M. A. Moraes, S. Piana, Y. B. Shan, B.
    Towles, In Proceedings of the Conference on High Performance Computing,
    Networking, Storage and Analysis, 2009.
    [92] K. Lindorff-Larsen, S. Piana, R. O. Dror, D. E. Shaw, Science 2011, 334,
    517.
    [93] J. N. Onuchic, Z. Luthey-Schulten, P. G. Wolynes, Annu. Rev. Phys.
    Chem. 1997, 48, 545.
    [94] P. G. Wolynes, Philos. T. Roy. Soc. A 2005, 363, 453.
    [95] M. Punta, B. Rost, Bioinformatics 2005, 21, 2960.
    [96] G. Shackelford, K. Karplus, Proteins 2007, 69, 159.
    [97] P. Fariselli, O. Olmea, A. Valencia, R. Casadio, Proteins 2001, Suppl 5,
    157.
    [98] P. Bjorkholm, P. Daniluk, A. Kryshtafovych, K. Fidelis, R. Andersson, T. R.
    Hvidsten, Bioinformatics 2009, 25, 1264.
    [99] K. M. S. Misura, D. Chivian, C. A. Rohl, D. E. Kim, D. Baker, Proc. Natl.
    Acad. Sci. USA 2006, 103, 5361.
    [100] J. Skolnick, D. Kihara, Y. Zhang, Proteins 2004, 56, 502.
    [101] M. Y. Shen, A. Sali, Protein Sci. 2006, 15, 2507.
    [102] J. Moult, Curr. Opin. Struct. Biol. 2005, 15, 285.
    [103] Y. Zhang, Curr. Opin. Struct. Biol. 2008, 18, 342.
    [104] D. S. Marks, T. A. Hopf, C. Sander, Nat. Biotechnol. 2012, 30, 1072.
    [105] P. Di Lena, K. Nagata, P. Baldi, Bioinformatics 2012, 28, 2449.
    [106] J. M. Chandonia, G. Hon, N. S. Walker, L. Lo Conte, P. Koehl, M. Levitt,
    S. E. Brenner, Nucleic Acids Res. 2004, 32, D189.
    [107] J. Eickholt, J. Cheng, Bioinformatics 2012, 28, 3066.
    [108] B. Monastyrskyy, K. Fidelis, A. Tramontano, A. Kryshtafovych, Proteins
    2011, 79, 119.
    [109] J. Lyons, A. Dehzangi, R. Heffernan, A. Sharma, K. Paliwal, A. Sattar, Y.
    Zhou, Y. Yang, J. Comput. Chem. 2014, 35, 2040.
    [110] E. Faraggi, T. Zhang, Y. Yang, L. Kurgan, Y. Zhou, J. Comput. Chem.
    2012, 33, 259.
    [111] R. Heffernan, K. Paliwal, J. Lyons, A. Dehzangi, A. Sharma, J. Wang, A.
    Sattar, Y. Yang, Y. Zhou, Sci. Rep. 2015, 5, 11476.
    [112] E. Faraggi, Y. D. Yang, S. S. Zhang, Y. Q. Zhou, Structure 2009, 17,
    1515.
    [113] G. L. Wang, R. L. Dunbrack, Nucleic Acids Res. 2005, 33, W94.
    [114] S. F. Altschul, T. L. Madden, A. A. Schaffer, J. H. Zhang, Z. Zhang, W.
    Miller, D. Lipman, J. Nucleic Acids Res. 1997, 25, 3389.
    [115] S. Altschul, T. Madden, A. Schaffer, J. H. Zhang, Z. Zhang, W. Miller, D.
    Lipman, FASEB J. 1998, 12, A1326.
    [116] J. Meiler, M. Muller, A. Zeidler, F. Schmaschke, J. Mol. Model. 2001, 7, 360.
    [117] B. Rost, J. Struct. Biol. 2001, 134, 204.
    [118] B. Alipanahi, A. Delong, M. T. Weirauch, B. J . Frey, Nat. Biotechnol.
    2015, 33, 831.
    [119] S. Zhang, J. Zhou, H. Hu, H. Gong, L. Chen, C. Cheng, J. Zeng, Nucleic
    Acids Res. 2016, 44, e32.
    [120] M. T. Weirauch, A. Cote, R. Norel, M. Annala, Y. Zhao, T. R. Riley, J.
    Saez-Rodriguez, T. Cokelaer, A. Vedenko, S. Talukder, H. J.
    Bussemaker, Q. D. Morris, M. L. Bulyk, G. Stolovitzky, T. R. Hughes, D.
    Consortium, Nat. Biotechnol. 2013, 31, 126.
    [121] Y. Shen, O. Lange, F. Delaglio, P. Rossi, J. M. Aramini, G. H. Liu, A.
    Eletsky, Y. B. Wu, K. K. Singarapu, A. Lemak, A. Ignatchenko, C. H.
    Arrowsmith, T. Szyperski, G. T. Montelione, D. Baker, A. Bax, Proc.
    Natl. Acad. Sci. USA 2008, 105, 4685.
    [122] K. Hansen, G. Montavon, F. Biegler, S. Fazli, M. Rupp, M. Scheffler, O.
    A. von Lilienfeld, A. Tkatchenko, K. R. Muller, J. Chem. Theory Comput.
    2013, 9, 3404.
    [123] G. Montavon, M. Rupp, V. Gobre, A. Vazquez-Mayagoitia, K. Hansen,
    A. Tkatchenko, K. R. M€uller, O. Anatole von Lilienfeld, New J. Phys.
    2013, 15, 095003.
    [124] R. Ramakrishnan, P. O. Dral, M. Rupp, O. A. von Lilienfeld, J. Chem.
    Theory Comput. 2015, 11, 2087.
    [125] A. Lopez-Bezanilla, O. A. von Lilienfeld, Phys. Rev. B 2014, 89, 235411.
    [126] P. O. Dral, O. A. von Lilienfeld, W. Thiel, J. Chem. Theory Comput.
    2015, 11, 2120.
    [127] F. Faber, A. Lindmaa, O. A. von Lilienfeld, R. Armiento, Int. J. Quantum
    Chem. 2015, 115, 1094.
    [128] O. A. von Lilienfeld, R. Ramakrishnan, M. Rupp, A. Knoll, Int. J. Quantum
    Chem. 2015, 115, 1084.
    [129] A. R. Katritzky, V. S. Lobanov, M. Karelson, Chem. Soc. Rev. 1995, 24,
    279.
    [130] T. Le, V. C. Epa, F. R. Burden, D. A. Winkler, Chem. Rev. 2012, 112, 2889.
    [131] S. V. Kalinin, B. G. Sumpter, R. K. Archibald, Nat. Mater. 2015, 14, 973.
    [132] C. M. Breneman, L. C. Brinson, L. S. Schadler, B. Natarajan, M. Krein, K.
    Wu, L. Morkowchuk, Y. Li, H. Deng, H. Xu, Adv. Funct. Mater. 2013, 23,
    5746.
    [133] A. Jain, S. P. Ong, G. Hautier, W. Chen, W. D. Richards, S. Dacek, S.
    Cholia, D. Gunter, D. Skinner, G. Ceder, K. A. Persson, APL Mater.
    2013, 1, 011002.
    [134] E. O. Pyzer-Knapp, K. Li, A. Aspuru-Guzik, Adv. Funct. Mater. 2015, 25,
    6495.
    [135] V. Venkatraman, S. Abburu, B. K. Alsberg, Phys. Chem. Chem. Phys.
    2015, 17, 27672.
    [136] A. Schuller, G. B. Goh, H. Kim, J. S. Lee, Y. T. Chang, Mol. Inf. 2010, 29,
    717.
    [137] M. Deetlefs, K. R. Seddon, M. Shara, Phys. Chem. Chem. Phys. 2006, 8,
    642.
    [138] D. Fourches, D. Q. Y. Pu, C. Tassa, R. Weissleder, S. Y. Shaw, R. J.
    Mumper, A. Tropsha, ACS Nano. 2010, 4, 5703.
    [139] Kaggle, Available at: http://www.kaggle.com/c/MerckActivity/
    leaderboard
    [140] G. Barta, Front. Env. Sci. 2016, 4, 1.
    [141] A. Abdelaziz, H. Spahn-Langguth, K. W. Schramm, I. V. Tetko, Front.
    Env. Sci. 2016, 4, 2.
    [142] J. Huang, A. D. MacKerell, J. Comput. Chem. 2013, 34, 2135.
    [143] K. A. Beauchamp, Y. S. Lin, R. Das, V. S. Pande, J. Chem. Theory Comput.
    2012, 8, 1409.
    [144] G. B. Goh, D. M. Eike, B. P. Murch, C. L. Brooks, J. Phys. Chem. B 2015,
    119, 6217.
    [145] M. B. Gee, N. R. Cox, Y. F. Jiao, N. Bentenitis, S. Weerasinghe, P. E.
    Smith, J. Chem. Theory Comput. 2011, 7, 1369.
    [146] Y. Luo, B. Roux, J. Phys. Chem. Lett. 2010, 1, 183.
    [147] M. T. Ribeiro, S. Singh, C. Guestrin, arXiv:1602.04938, 2016.
    [148] M. T. Ribeiro, S. Singh, C. Guestrin, arxiv:1606.05386, 2016.
    [149] A. Lusci, D. Fooshee, M. Browning, J. Swamidass, P. Baldi, J. Cheminform.
    2015, 7.
    [150] S. J. Swamidass, C. A. Azencott, T. W.

    展开全文
  • 2020年危险化学品经营单位主要负责人考试题库及危险化学品经营单位主要负责人考试申请表,包含危险化学品经营单位主要负责人考试题库答案和解析及危险化学品经营单位主要负责人考试申请表练习。由安全生产模拟考试...
  • 危险化学品生产单位安全生产管理人员考试内容根据新危险化学品生产单位安全生产管理人员考试大纲要求,安全生产模拟考试一点通将危险化学品生产单位安全生产管理人员模拟考试试题进行汇编,组成一套危险化学品生产...
  • 危险化学品经营单位主要负责人考试报名考前必练!安全生产模拟考试一点通每个月更新危险化学品经营单位主要负责人新版试题题目及答案!多做几遍,其实通过危险化学品经营单位主要负责人作业模拟考试很简单。 1、...
  • 51nod-1483 化学变换

    2018-04-25 22:06:50
    1483 化学变换 题目来源: CodeForces基准时间限制:1 秒 空间限制:131072 KB 分值: 20 难度:3级算法题 收藏 关注有n种不同的化学试剂。第i种有ai升。每次实验都要把所有的化学试剂混在一起,但是这些...
  • 危险化学品生产单位安全生产管理人员最新解析是安全生产模拟考试一点通总题库中随机出的一套危险化学品生产单位安全生产管理人员找解析,在公众号安全生产模拟考试一点通上点击危险化学品生产单位安全生产管理人员...
  • 为分析矿井充水水源水质特征,为判别突水水源提供理论依据,将多元对应分析方法应用于潘一煤矿各含水层水质特征区分以及同一含水层内垂向上水质变化的分析,并将分析结果和Piper图进行比较,结果表明:多元对应分析法可以...
  • 51nod 1483 化学变换

    2017-08-03 23:28:21
    并没有想到怎么去做,看的别人的思想。 玩的还是暴力。...统计的时候,如果当前数字num是个奇数,则num/2要一直*2打表到1e5之外,如果num是个偶数,则num/2则不需要*2向上打表了,因为那些都在num
  • 珊瑚矿区钨锡矿床或矿地球化学作用多期多阶段的特点,突出表现为平面上的...气成热液地球化学作用导致钨锡石英脉矿床垂向上表现为逆向分带,W、Sn、F等成为矿体前缘指示元素,而Cu、Pb、zn等成为矿体中下部指示元素。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,571
精华内容 1,428
关键字:

化学向上