精华内容
下载资源
问答
  • 为了测量惯性约束聚变实验中的聚变反应时间过程,研制了一套时间分辨优于40 ps的聚变反应历程测量系统。该系统由闪烁体及鼻锥部分、光学系统和条纹相机系统三部分组成。其中闪烁体将中子信号转换为可见光信号,光学...
  • 并基于密度泛函理论(DFT),在B3LYP/6-31G水平下对相关基元反应进行定量分析,计算出相应热力学数据,然后用反应内禀坐标法验证反应路径,结合反应动力学来分析C2H4对甲烷爆炸反应历程的影响。结果表明:少量C2H4可使...
  • 将化学反应视为抽象的“化学流”,提出“完全速率方程”的概念,并阐述其物理意义,考察了完全速率方程的各种破缺形式及其所对应的反应历程的特性及自催化作用对速率方程的影响.通过举例说明,归纳总结了由速率方程...
  • 以天然竹原纤维为原料,探讨了环氧氯丙烷、β-环糊精、含氟环氧化合物等十余种化学改性剂应用于竹原纤维的接枝改性,分析了各种不同化学改性剂用于竹原纤维接枝改性的反应历程,对开发具有多功能、高性能、好品质的...
  • 为了搞清楚木质碳纤维在炭化、石墨化过程中化学反应的路径以及微细结构的生成演化机制,归纳了迄今为止诸多研究者在木质碳纤维制备技术与基本性能,木质碳纤维在炭化、石墨化不同处理过程中的化学反应历程,以及微细...
  • 酪蛋白-胰酶体系反应历程分子量变化模拟与三维表征,苏荣欣,殷文文,食源性活性多肽的生物活性功能具有很强的分子量依赖性,不同分子量的多肽有不同的功能。本文运用人工神经网络模拟了酪蛋白在胰酶
  • 介绍通过手性柱色质联用技术分析经典有机化学实验“正溴丁烷的制备”的产物,整合分散在...这不仅有助于学生认知和掌握这些产物的形成历程,还有助于拓展经典有机化学实验的深度和广度,激发学生学习有机化学的兴趣。
  • 基于过渡中间态理论,探讨了蒸气发生反应历程 。考 察和比较了络合剂、金属离子、表面活性剂的增感效应,提出了8-羟基喹啉、邻菲罗啉、钴离子、阳离子表面 活性剂CTAB和非离子表面活性剂 Triton X-100对原子荧光的增感...
  • 卤代反应是一个重要而又特殊的反应,本文包括有机化学中常涉及的几个α-卤代反应。对反应原理、原因作出理论分析,解释理解上的难点,并指明易出错和易混淆的地方,简述了它们在合成上的应用。
  • 熔盐电脱氧法制备钛铬合金反应历程与双组分体系间相互影响的研究,李泽全,刘楠,采用FFC法,在熔融CaCl2体系中,以TiO2和Cr2O3的混合物为阴极,石墨为阳极,在900℃、3.2V条件下进行电解。采用XRD、SEM-EDS等方法对...
  • 2 小结 人工智能主要分支【了解】 计算机视觉 语音识别 文本挖掘/分类 机器翻译 机器人 1.4 机器学习工作流程 1 什么是机器学习 机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。 2 机器学习...

    日萌社

    人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新)


    1.1 人工智能概述

    1 人工智能应用场景

    2 人工智能小案例

    案例一:

    参考链接:https://quickdraw.withgoogle.com

    案例二:

    参考链接:https://pjreddie.com/darknet/yolo/

    案例三:

    查看更多:https://deepdreamgenerator.com/

    3 人工智能发展必备三要素:

    • 数据
    • 算法
    • 计算力
      • CPU,GPU,TPU

    • 计算力之CPU、GPU对比:

      • CPU主要适合I\O密集型的任务

      • GPU主要适合计算密集型任务

    • 提问:什么类型的程序适合在GPU上运行?

    (1)计算密集型的程序。

    所谓计算密集型(Compute-intensive)的程序,就是其大部分运行时间花在了寄存器运算上,寄存器的速度和处理器的速度相当,从寄存器读写数据几乎没有延时。可以做一下对比,读内存的延迟大概是几百个时钟周期;读硬盘的速度就不说了,即便是SSD, 也实在是太慢了。  

    (2)易于并行的程序。

    GPU其实是一种SIMD(Single Instruction Multiple Data)架构, 他有成百上千个核,每一个核在同一时间最好能做同样的事情。

    CPU和GPU的区别:

    http://www.sohu.com/a/201309334_468740

    Google TPU 介绍:

    https://buzzorange.com/techorange/2017/09/27/what-intel-google-nvidia-microsoft-do-for-ai-chips/

    4 人工智能、机器学习和深度学习

    • 人工智能和机器学习,深度学习的关系
      • 机器学习是人工智能的一个实现途径
      • 深度学习是机器学习的一个方法发展而来

    4 小结

    • 人工智能应用场景【了解】
      • 网络安全、电子商务、计算模拟、社交网络 … ...
    • 人工智能必备三要素【知道】
      • 数据、算法、计算力
    • 人工智能和机器学习,深度学习的关系【知道】
      • 机器学习是人工智能的一个实现途径
      • 深度学习是机器学习的一个方法发展而来

    1.2 人工智能发展历程

    1 人工智能的起源

    1.1 图灵测试

    测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。

    多次测试(一般为5min之内),如果有超过30%的测试者不能确定被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能

    1.2 达特茅斯会议

    1956年8月,在美国汉诺斯小镇宁静的达特茅斯学院中,

    ​ 约翰·麦卡锡(John McCarthy)

    ​ 马文·闵斯基(Marvin Minsky,人工智能与认知学专家)

    ​ 克劳德·香农(Claude Shannon,信息论的创始人)

    ​ 艾伦·纽厄尔(Allen Newell,计算机科学家)

    ​ 赫伯特·西蒙(Herbert Simon,诺贝尔经济学奖得主)等科学家正聚在一起,讨论着一个完全不食人间烟火的主题:

    用机器来模仿人类学习以及其他方面的智能。

    会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字:

    ​ 人工智能

    因此,1956年也就成为了人工智能元年。

    2 发展历程

    人工智能充满未知的探索道路曲折起伏。如何描述人工智能自1956年以来60余年的发展历程,学术界可谓仁者见仁、智者见智。我们将人工智能的发展历程划分为以下6个阶段:

    • 第一是起步发展期:1956年—20世纪60年代初。

      人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。

    • 第二是反思发展期:20世纪60年代—70年代初。

      人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标的落空(例如,无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展走入低谷。

    • 第三是应用发展期:20世纪70年代初—80年代中。

      20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。

    • 第四是低迷发展期:20世纪80年代中—90年代中。

      随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。

    • 第五是稳步发展期:20世纪90年代中—2010年。

      由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年国际商业机器公司(简称IBM)深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念。以上都是这一时期的标志性事件。

    • 第六是蓬勃发展期:2011年至今。

      随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长的新高潮。

    3 小结

    • 人工智能的起源【了解】
      • 图灵测试
      • 达特茅斯会议
    • 人工智能的发展经历了六个阶段【了解】
      • 起步发展期
      • 反思发展期
      • 应用发展期
      • 低迷发展期
      • 稳步发展期
      • 蓬勃发展期

    1.3 人工智能主要分支

    1 主要分支介绍

    通讯、感知与行动是现代人工智能的三个关键能力,在这里我们将根据这些能力/应用对这三个技术领域进行介绍:

    • 计算机视觉(CV)、
    • 自然语言处理(NLP)
      • 在 NLP 领域中,将覆盖文本挖掘/分类、机器翻译和语音识别。
    • 机器人

    1.1 分支一:计算机视觉

    计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。物体检测和人脸识别是其比较成功的研究领域。

    当前阶段:

    计算机视觉现已有很多应用,这表明了这类技术的成就,也让我们将其归入到应用阶段。随着深度学习的发展,机器甚至能在特定的案例中实现超越人类的表现。但是,这项技术离社会影响阶段还有一定距离,那要等到机器能在所有场景中都达到人类的同等水平才行(感知其环境的所有相关方面)。

    发展历史:

    1.2 分支二:语音识别

    语音识别是指识别语音(说出的语言)并将其转换成对应文本的技术。相反的任务(文本转语音/TTS)也是这一领域内一个类似的研究主题。

    当前阶段:

    语音识别已经处于应用阶段很长时间了。最近几年,随着大数据和深度学习技术的发展,语音识别进展颇丰,现在已经非常接近社会影响阶段了。

    语音识别领域仍然面临着声纹识别「鸡尾酒会效应」等一些特殊情况的难题。

    现代语音识别系统严重依赖于云,在离线时可能就无法取得理想的工作效果。

    发展历史:

    百度语音识别:

    • 距离小于1米,中文字准率97%+
    • 支持耳语、长语音、中英文混合及方言

    1.3 分支三:文本挖掘/分类

    这里的文本挖掘主要是指文本分类,该技术可用于理解、组织和分类结构化或非结构化文本文档。其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。

    当前阶段:

    我们将这项技术归类到应用阶段,因为现在有很多应用都已经集成了基于文本挖掘的情绪分析或垃圾信息检测技术。文本挖掘技术也在智能投顾的开发中有所应用,并且提升了用户体验。

    文本挖掘和分类领域的一个瓶颈出现在歧义和有偏差的数据上。

    发展历史:

    1.4 分支四:机器翻译

    机器翻译(MT)是利用机器的力量自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)。

    当前阶段:

    机器翻译是一个见证了大量发展历程的应用领域。该领域最近由于神经机器翻译而取得了非常显著的进展,但仍然没有全面达到专业译者的水平;但是,我们相信在大数据、云计算和深度学习技术的帮助下,机器翻译很快就将进入社会影响阶段。

    在某些情况下,俚语和行话等内容的翻译会比较困难(受限词表问题)。

    专业领域的机器翻译(比如医疗领域)表现通常不好

    发展历史:

    1.5 分支五:机器人

    机器人学(Robotics)研究的是机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理。

    机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。

    当前阶段:

    自上世纪「Robot」一词诞生以来,人们已经为工业制造业设计了很多机器人。工业机器人是增长最快的应用领域,它们在 20 世纪 80 年代将这一领域带入了应用阶段。在安川电机、Fanuc、ABB、库卡等公司的努力下,我们认为进入 21 世纪之后,机器人领域就已经进入了社会影响阶段,此时各种工业机器人已经主宰了装配生产线。此外,软体机器人在很多领域也有广泛的应用,比如在医疗行业协助手术或在金融行业自动执行承销过程。

    但是,法律法规和「机器人威胁论」可能会妨碍机器人领域的发展。还有设计和制造机器人需要相对较高的投资

    发展历史

    总的来说,人工智能领域的研究前沿正逐渐从搜索、知识和推理领域转向机器学习、深度学习、计算机视觉和机器人领域。

    大多数早期技术至少已经处于应用阶段了,而且其中一些已经显现出了社会影响力。一些新开发的技术可能仍处于工程甚至研究阶段,但是我们可以看到不同阶段之间转移的速度变得越来越快。

    2 小结

    • 人工智能主要分支【了解】
      • 计算机视觉
      • 语音识别
      • 文本挖掘/分类
      • 机器翻译
      • 机器人

    1.4 机器学习工作流程

    1 什么是机器学习

    机器学习是从数据自动分析获得模型,并利用模型对未知数据进行预测。

    2 机器学习工作流程

    • 机器学习工作流程总结
      • 1.获取数据
      • 2.数据基本处理
      • 3.特征工程
      • 4.机器学习(模型训练)
      • 5.模型评估
        • 结果达到要求,上线服务
        • 没有达到要求,重新上面步骤

    2.1 获取到的数据集介绍

    • 数据简介

      在数据集中一般:

      • 一行数据我们称为一个样本
      • 一列数据我们成为一个特征
      • 有些数据有目标值(标签值),有些数据没有目标值(如上表中,电影类型就是这个数据集的目标值)
    • 数据类型构成:

      • 数据类型一:特征值+目标值(目标值是连续的和离散的)
      • 数据类型二:只有特征值,没有目标值
    • 数据分割:

      • 机器学习一般的数据集会划分为两个部分:
        • 训练数据:用于训练,构建模型
        • 测试数据:在模型检验时使用,用于评估模型是否有效
      • 划分比例:
        • 训练集:70% 80% 75%
        • 测试集:30% 20% 25%

    2.2 数据基本处理

    ​ 即对数据进行缺失值、去除异常值等处理

    2.3 特征工程

    2.3.1什么是特征工程

    特征工程是使用专业背景知识和技巧处理数据使得特征能在机器学习算法上发挥更好的作用的过程

    • 意义:会直接影响机器学习的效果

    2.3.2 为什么需要特征工程(Feature Engineering)

    机器学习领域的大神Andrew Ng(吴恩达)老师说“Coming up with features is difficult, time-consuming, requires expert knowledge. “Applied machine learning” is basically feature engineering. ”

    注:业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

    2.3.3 特征工程包含内容

    • 特征提取
    • 特征预处理
    • 特征降维

    2.3.4 各概念具体解释

    • 特征提取

      • 将任意数据(如文本或图像)转换为可用于机器学习的数字特征

    2.4 机器学习

    选择合适的算法对模型进行训练(具体内容见1.5)

    2.5 模型评估

    对训练好的模型进行评估(具体内容见1.6)

    3 小结

    • 机器学习定义【掌握】
      • 机器学习是从数据自动分析获得模型,并利用模型对未知数据进行预测
    • 机器学习工作流程总结【掌握】
      • 1.获取数据
      • 2.数据基本处理
      • 3.特征工程
      • 4.机器学习(模型训练)
      • 5.模型评估
        • 结果达到要求,上线服务
        • 没有达到要求,重新上面步骤
    • 获取到的数据集介绍【掌握】
      • 数据集中一行数据一般称为一个样本,一列数据一般称为一个特征。
      • 数据集的构成:
        • 由特征值+目标值(部分数据集没有)构成
      • 为了模型的训练和测试,把数据集分为:
        • 训练数据(70%-80%)和测试数据(20%-30%)
    • 特征工程包含内容【了解】
      • 特征提取
      • 特征预处理
      • 特征降维

    完整机器学习项目的流程(拓展阅读)

    1 抽象成数学问题

    明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。

    这里的抽象成数学问题,指的明确我们可以获得什么样的数据,抽象出的问题,是一个分类还是回归或者是聚类的问题。

    2 获取数据

    数据决定了机器学习结果的上限,而算法只是尽可能逼近这个上限。

    数据要有代表性,否则必然会过拟合。

    而且对于分类问题,数据偏斜不能过于严重,不同类别的数据数量不要有数量级的差距。

    而且还要对数据的量级有一个评估,多少个样本,多少个特征,可以估算出其对内存的消耗程度,判断训练过程中内存是否能够放得下。如果放不下就得考虑改进算法或者使用一些降维的技巧了。如果数据量实在太大,那就要考虑分布式了。

    3 特征预处理与特征选择

    良好的数据要能够提取出良好的特征才能真正发挥作用。

    特征预处理、数据清洗是很关键的步骤,往往能够使得算法的效果和性能得到显著提高。归一化、离散化、因子化、缺失值处理、去除共线性等,数据挖掘过程中很多时间就花在它们上面。这些工作简单可复制,收益稳定可预期,是机器学习的基础必备步骤。

    筛选出显著特征、摒弃非显著特征,需要机器学习工程师反复理解业务。这对很多结果有决定性的影响。特征选择好了,非常简单的算法也能得出良好、稳定的结果。这需要运用特征有效性分析的相关技术,如相关系数、卡方检验、平均互信息、条件熵、后验概率、逻辑回归权重等方法。

    4 训练模型与调优

    直到这一步才用到我们上面说的算法进行训练。现在很多算法都能够封装成黑盒供人使用。但是真正考验水平的是调整这些算法的(超)参数,使得结果变得更加优良。这需要我们对算法的原理有深入的理解。理解越深入,就越能发现问题的症结,提出良好的调优方案。

    5 模型诊断

    如何确定模型调优的方向与思路呢?这就需要对模型进行诊断的技术。

    过拟合、欠拟合 判断是模型诊断中至关重要的一步。常见的方法如交叉验证,绘制学习曲线等。过拟合的基本调优思路是增加数据量,降低模型复杂度。欠拟合的基本调优思路是提高特征数量和质量,增加模型复杂度。

    误差分析 也是机器学习至关重要的步骤。通过观察误差样本全面分析产生误差的原因:是参数的问题还是算法选择的问题,是特征的问题还是数据本身的问题……

    诊断后的模型需要进行调优,调优后的新模型需要重新进行诊断,这是一个反复迭代不断逼近的过程,需要不断地尝试, 进而达到最优状态。

    6 模型融合

    一般来说,模型融合后都能使得效果有一定提升。而且效果很好。

    工程上,主要提升算法准确度的方法是分别在模型的前端(特征清洗和预处理,不同的采样模式)与后端(模型融合)上下功夫。因为他们比较标准可复制,效果比较稳定。而直接调参的工作不会很多,毕竟大量数据训练起来太慢了,而且效果难以保证。

    7 上线运行

    这一部分内容主要跟工程实现的相关性比较大。工程上是结果导向,模型在线上运行的效果直接决定模型的成败。 不单纯包括其准确程度、误差等情况,还包括其运行的速度(时间复杂度)、资源消耗程度(空间复杂度)、稳定性是否可接受。

    这些工作流程主要是工程实践上总结出的一些经验。并不是每个项目都包含完整的一个流程。这里的部分只是一个指导性的说明,只有大家自己多实践,多积累项目经验,才会有自己更深刻的认识。


    1.5 机器学习算法分类

    根据数据集组成不同,可以把机器学习算法分为:

    • 监督学习

    • 无监督学习

    • 半监督学习
    • 强化学习

    1 监督学习

    • 定义:

      • 输入数据是由输入特征值和目标值所组成。
        • 函数的输出可以是一个连续的值(称为回归),
        • 或是输出是有限个离散值(称作分类)。

    1.1 回归问题

    例如:预测房价,根据样本集拟合出一条连续曲线。

    1.2 分类问题

    例如:根据肿瘤特征判断良性还是恶性,得到的是结果是“良性”或者“恶性”,是离散的。

    2 无监督学习

    • 定义:

      • 输入数据是由输入特征值组成,没有目标值

        • 输入数据没有被标记,也没有确定的结果。样本数据类别未知;
        • 需要根据样本间的相似性对样本集进行类别划分。

      举例:

    3 半监督学习

    • 定义:
      • 训练集同时包含有标记样本数据和未标记样本数据。

    举例:

    • 监督学习训练方式:

    4 强化学习

    • 定义:
      • 实质是make decisions 问题,即自动进行决策,并且可以做连续决策。

    举例:

    小孩想要走路,但在这之前,他需要先站起来,站起来之后还要保持平衡,接下来还要先迈出一条腿,是左腿还是右腿,迈出一步后还要迈出下一步。

    小孩就是 agent,他试图通过采取行动(即行走)来操纵环境(行走的表面),并且从一个状态转变到另一个状态(即他走的每一步),当他完成任务的子任务(即走了几步)时,孩子得到奖励(给巧克力吃),并且当他不能走路时,就不会给巧克力。

    主要包含五个元素:agent, action, reward, environment, observation;

    强化学习的目标就是获得最多的累计奖励

    监督学习和强化学习的对比

    拓展阅读:Alphago进化史 漫画告诉你Zero为什么这么牛:

    http://sports.sina.com.cn/chess/weiqi/2017-10-21/doc-ifymyyxw4023875.shtml


    独立同分布IID(independent and identically distributed)

    1.独立同分布(i.i.d.)

    在概率统计理论中,如果变量序列或者其他随机变量有相同的概率分布,并且互相独立,那么这些随机变量是独立同分布。

    在西瓜书中解释是:输入空间中的所有样本服从一个隐含未知的分布,训练数据所有样本都是独立地从这个分布上采样而得。

    2.简单解释 — 独立、同分布、独立同分布

    (1)独立:每次抽样之间没有关系,不会相互影响

    举例:给一个骰子,每次抛骰子抛到几就是几,这是独立;如果我要抛骰子两次之和大于8,那么第一次和第二次抛就不独立,因为第二次抛的结果和第一次相关。

    (2)同分布:每次抽样,样本服从同一个分布

    举例:给一个骰子,每次抛骰子得到任意点数的概率都是六分之一,这个就是同分布

    (3)独立同分布:i.i.d.,每次抽样之间独立而且同分布

    3.机器学习领域的重要假设

    IID独立同分布即假设训练数据和测试数据是满足相同分布的,它是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。

    4.目前发展

    机器学习并不总要求独立同分布,在不少问题中要求样本数据采样自同一个分布是因为希望用训练数据集得到的模型可以合理的用于测试数据集,使用独立同分布假设能够解释得通。

    目前一些机器学习内容已经不再囿于独立同分布假设下,一些问题会假设样本没有同分布


    1.6 模型评估

    模型评估是模型开发过程不可或缺的一部分。它有助于发现表达数据的最佳模型和所选模型将来工作的性能如何。

    按照数据集的目标值不同,可以把模型评估分为分类模型评估和回归模型评估。

    1 分类模型评估

    • 准确率

      • 预测正确的数占样本总数的比例。
    • 其他评价指标:精确率、召回率、F1-score、AUC指标等

    2 回归模型评估

    均方根误差(Root Mean Squared Error,RMSE)

    • RMSE是一个衡量回归模型误差率的常用公式。 不过,它仅能比较误差是相同单位的模型。

    举例:

    假设上面的房价预测,只有五个样本,对应的
    真实值为:100,120,125,230,400
    预测值为:105,119,120,230,410
    

    那么使用均方根误差求解得:

    其他评价指标:相对平方误差(Relative Squared Error,RSE)、平均绝对误差(Mean Absolute Error,MAE)、相对绝对误差(Relative Absolute Error,RAE)

    3 拟合

    模型评估用于评价训练好的的模型的表现效果,其表现效果大致可以分为两类:过拟合、欠拟合。

    在训练过程中,你可能会遇到如下问题:

    训练数据训练的很好啊,误差也不大,为什么在测试集上面有问题呢?

    当算法在某个数据集当中出现这种情况,可能就出现了拟合问题。

    3.1 欠拟合

    因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。

    欠拟合(under-fitting)模型学习的太过粗糙,连训练集中的样本数据特征关系都没有学出来

    3.2 过拟合

    机器已经基本能区别天鹅和其他动物了。然后,很不巧已有的天鹅图片全是白天鹅的,于是机器经过学习后,会认为天鹅的羽毛都是白的,以后看到羽毛是黑的天鹅就会认为那不是天鹅。

    过拟合(over-fitting):所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在测试数据集中表现不佳

    • 上问题解答:
      • 训练数据训练的很好啊,误差也不大,为什么在测试集上面有问题呢?

    4 小结

    • 分类模型评估【了解】
      • 准确率
    • 回归模型评估【了解】
      • RMSE -- 均方根误差
    • 拟合【知道】
      • 举例 -- 判断是否是人
      • 欠拟合
        • 学习到的东西太少
        • 模型学习的太过粗糙
      • 过拟合
        • 学习到的东西太多
        • 学习到的特征多,不好泛化

    1.8 深度学习简介

    1 深度学习 —— 神经网络简介

    深度学习(Deep Learning)(也称为深度结构学习【Deep Structured Learning】、层次学习【Hierarchical Learning】或者是深度机器学习【Deep Machine Learning】)是一类算法集合,是机器学习的一个分支。

    深度学习方法近年来,在会话识别、图像识别和对象侦测等领域表现出了惊人的准确性。

    但是,“深度学习”这个词语很古老,它在1986年由Dechter在机器学习领域提出,然后在2000年有Aizenberg等人引入到人工神经网络中。而现在,由于Alex Krizhevsky在2012年使用卷积网络结构赢得了ImageNet比赛之后受到大家的瞩目。

    卷积网络之父:Yann LeCun

    深度学习演示

    2 深度学习各层负责内容

    神经网络各层负责内容:

    1层:负责识别颜色及简单纹理

    2层:一些神经元可以识别更加细化的纹理,布纹,刻纹,叶纹等

    3层:一些神经元负责感受黑夜里的黄色烛光,高光,萤火,鸡蛋黄色等。

    4层:一些神经元识别萌狗的脸,宠物形貌,圆柱体事物,七星瓢虫等的存在。

    5层:一些神经元负责识别花,黑眼圈动物,鸟,键盘,原型屋顶等。

    4 小结

    • 深度学习的发展源头--神经网络【了解】
    • 多层神经网络,在最初几层是识别简单内容,后面几层是识别一些复杂内容。【了解】
    展开全文
  • Java语言

    千次阅读 2020-01-19 12:22:35
    Java起初是用作编写消费类家用电子产品软件的语言(可以去看看Java的发展历程),所以它是被设计成写高可靠和稳健软件的。Java消除了一些编程错误,使得用它写软件与其他语言更加简单便捷。Java是一个 强类型语言 ,...

                                                   Java语言

    目录

                                                       Java语言

     

    一:SUN概述:

    二:背景:

    三:Java语言的优点:

    1).简单性

    2).纯面向对象

    3).编译和解释性

    4).稳健性

    5).安全性

    6).可移植性

    7).高性能

    8).分布性

    9).类库丰富

    一:SUN概述:

    Sun 公司对Java语言的描述:“Java is simple,object-oriented,distributed,interproted,robust, secure,architecture neutral,portable,high-performance,multithreaded,and dynamic language。”

    二:背景:

    学习Java首先听到最多的应该就是面向对象了,所以说Java就是是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承(Java里面是没有类的多继承的)、指针(Nopoint)等概念,因此Java语言具有功能强大和简单易用两个特征,所以说Java的发展来自于C++,或者说Java语言就是有C++语言改进并重新设计而来的一门编程语言。

    Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的思维方式进行复杂的编程 。

    Java具有简单性、面向对象、分布式、健壮性、安全性、平台独立与可移植性、多线程、动态性等特点 。Java可以编写桌面级应用程序、WEB应用程序、分布式系统和嵌入式系统应用程序等 。

    三:Java语言的优点:

    Java语言具有以下几个特点:

    1).简单性

    Java看起来设计得很像C++,上面就已经提到过Java的由来(Java发展史),但是为了使Java变得小巧和容易熟悉,所以设计者在设计之初就将C++中的一些特征去掉了(比如go to语句,操作符过载和多继承特征等)。因为Java变成了“一切皆对象”的理念,所以不需要指针。Java能够自动处理对象的引用和间接引用,实现自动的无用单元收集,使用户不必为存储管理问题烦恼,能更多的时间和精力花在研发上。

    2).纯面向对象

    Java是一个面向对象的语言(Everything is Object)。所以说对开发者来说,这意味着它可以直接反应现实生活中的对象(如:树,汽车,人等)。在一个面向对象的系统中,类是数据和操作数据的方法的集合。数据和方法一起描述对象的状态和行为。每一对象是其状态和行为的封装。类是按一定体系和层次安排的,使得子类可以从超类继承行为。在这个类层次体系中有一个根类,它是具有一般行为的类。Java程序是用类来组织的。

    3).编译和解释性

    Java编译程序生成字节码文件,而不是通常的机器码(即二进制)。Java字节码提供对体系结构中性的目标文件格式,代码设计成可有效地“搬运”程序到不同的平台和环境中。在一个解释性的环境中,程序开发的标准"链接"阶段大大消失了。如果说Java还有一个链接阶段,它只是把新类装进环境的过程,它是增量式的、轻量级的过程。因此,Java支持快速原型和容易试验,它将导致快速程序开发。这是一个与传统的、耗时的"编译、链接和测试"形成鲜明对比的精巧的开发过程。

    4).稳健性

    Java起初是用作编写消费类家用电子产品软件的语言(可以去看看Java的发展历程),所以它是被设计成写高可靠和稳健软件的。Java消除了一些编程错误,使得用它写软件与其他语言更加简单便捷。Java是一个强类型语言,它允许扩展编译时检查潜在类型不匹配问题的功能。Java要求显式的方法声明,而不是C语言式的隐式声明。这些严格的要求保证编译程序能捕捉调用错误,这就导致更可靠的程序。

    可靠性方面最重要的增强之一是Java的存储模型。Java不支持指针(空指针),它消除重写存储和讹误数据的可能性。类似地,Java自动的"无用单元收集"预防存储漏泄和其它有关动态存储分配和解除分配的有害错误。Java解释程序也执行许多运行时的检查,诸如验证所有数组和串访问是否在界限之内。

    异常处理是Java中使得程序更稳健的另一个特征。异常是某种类似于错误的异常条件出现的信号。使用try/catch/finally语句,开发者可以找到出错的处理代码或者觉得在代码运行时会出错的地方的进行异常处理,这就简化了出错处理和恢复的任务。

    5).安全性

    Java的存储分配模型是它防御恶意代码的主要方法之一。Java没有指针,所以开发者就不能得到隐蔽起来的内幕和伪造指针去指向存储器。更重要的是,Java编译程序不处理存储安排决策,所以程序员不能通过查看声明去猜测类的实际存储安排。编译的Java代码中的存储引用在运行时由Java解释程序决定实际存储地址。

    Java运行系统使用字节码验证过程来保证装载到网络上的代码不违背任何Java语言限制。这个安全机制部分包括类如何从网上装载。例如,装载的类是放在分开的名字空间而不是局部类,预防恶意的小应用程序用它自己的版本来代替标准Java类。

    6).可移植性

    Java使得语言声明不依赖于实现的方面。例如,Java显式说明每个基本数据类型的大小和它的运算行为。程序一次编写,各处运行。Java环境本身对新的硬件平台和操作系统是可移植的,而Java编译程序也用Java编写,而Java运行系统用ANSIC语言编写(这就是关键点),这样一来不管平台是否相同,编译环境一样即可运行Java程序。

    7).高性能

    Java是一种先编译后解释的语言,所以它不如全编译性语言快。但是有些情况下性能是很要紧的,为了支持这些情况,Java设计者制作了"及时"编译程序,它能在运行时把Java字节码翻译成特定CPU(中央处理器)的机器代码,也就是实现全编译了,Java字节码格式设计时考虑到这些"及时"编译程序的需要,所以生成机器代码的过程相当简单,它能产生相当好的代码。

    8).分布性

    Java设计成支持在网络上应用,它是分布式语言。Java既支持各种层次的网络连接,又以Socket类支持可靠的流网络连接,所以用户可以产生分布式的客户机和服务器。网络变成软件应用的分布运载工具。Java程序只要编写一次,就可到处运行。

    9).类库丰富

    Java提供了很多丰富的内置类库,通过这些类库,可以简化开发者的程序设计工作,简化操作,同时缩短了项目开发时间(时间就是金钱嘛)。

    展开全文
  • 图像分割综述

    万次阅读 多人点赞 2019-07-09 22:03:48
    近年来还提出了基于曲面拟合的方法、基于边界曲线拟合的方法、基于反应-扩散方程的方法、串行边界查找、基于变形模型的方法。 边缘检测的优缺点: (1)边缘定位准确; (2)速度快; (3)不能保证边缘的连续...

    本文作者净浩泽,公众号:计算机视觉life,编辑成员

    图像分割是计算机视觉研究中的一个经典难题,已经成为图像理解领域关注的一个热点,图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的说就是在一副图像中,把目标从背景中分离出来。对于灰度图像来说,区域内部的像素一般具有灰度相似性,而在区域的边界上一般具有灰度不连续性。 关于图像分割技术,由于问题本身的重要性和困难性,从20世纪70年代起图像分割问题就吸引了很多研究人员为之付出了巨大的努力。虽然到目前为止,还不存在一个通用的完美的图像分割的方法,但是对于图像分割的一般性规律则基本上已经达成的共识,已经产生了相当多的研究成果和方法。

    本文对于目前正在使用的各种图像分割方法进行了一定的归纳总结,由于笔者对于图像分割的了解也是初窥门径,所以难免会有一些错误,还望各位读者多多指正,共同学习进步。

    传统分割方法

    这一大部分我们将要介绍的是深度学习大火之前人们利用数字图像处理、拓扑学、数学等方面的只是来进行图像分割的方法。当然现在随着算力的增加以及深度学习的不断发展,一些传统的分割方法在效果上已经不能与基于深度学习的分割方法相比较了,但是有些天才的思想还是非常值得我们去学习的。
    1.基于阈值的分割方法
    阈值法的基本思想是基于图像的灰度特征来计算一个或多个灰度阈值,并将图像中每个像素的灰度值与阈值作比较,最后将像素根据比较结果分到合适的类别中。因此,该方法最为关键的一步就是按照某个准则函数来求解最佳灰度阈值。
    阈值法特别适用于目标和背景占据不同灰度级范围的图。
    图像若只有目标和背景两大类,那么只需要选取一个阈值进行分割,此方法成为单阈值分割;但是如果图像中有多个目标需要提取,单一阈值的分割就会出现作物,在这种情况下就需要选取多个阈值将每个目标分隔开,这种分割方法相应的成为多阈值分割。

    如图所示即为对数字的一种阈值分割方法。
    阀值分割方法的优缺点:

    • 计算简单,效率较高;
    • 只考虑像素点灰度值本身的特征,一般不考虑空间特征,因此对噪声比较敏感,鲁棒性不高。
      从前面的介绍里我们可以看出,阈值分割方法的最关键就在于阈值的选择。若将智能遗传算法应用在阀值筛选上,选取能最优分割图像的阀值,这可能是基于阀值分割的图像分割法的发展趋势。
      2.基于区域的图像分割方法
      基于区域的分割方法是以直接寻找区域为基础的分割技术,基于区域提取方法有两种基本形式:一种是区域生长,从单个像素出发,逐步合并以形成所需要的分割区域;另一种是从全局出发,逐步切割至所需的分割区域。
      区域生长
      区域生长是从一组代表不同生长区域的种子像素开始,接下来将种子像素邻域里符合条件的像素合并到种子像素所代表的生长区域中,并将新添加的像素作为新的种子像素继续合并过程,知道找不到符合条件的新像素为止(小编研一第一学期的机器学习期末考试就是手写该算法 T.T),该方法的关键是选择合适的初始种子像素以及合理的生长准则。
      区域生长算法需要解决的三个问题:
      (1)选择或确定一组能正确代表所需区域的种子像素;
      (2)确定在生长过程中能将相邻像素包括进来的准则;
      (3)指定让生长过程停止的条件或规则。
      区域分裂合并
      区域生长是从某个或者某些像素点出发,最终得到整个区域,进而实现目标的提取。而分裂合并可以说是区域生长的逆过程,从整幅图像出发,不断的分裂得到各个子区域,然后再把前景区域合并,得到需要分割的前景目标,进而实现目标的提取。其实如果理解了上面的区域生长算法这个区域分裂合并算法就比较好理解啦。
      四叉树分解法就是一种典型的区域分裂合并法,基本算法如下:
      (1)对于任一区域,如果H(Ri)=FALSE就将其分裂成不重叠的四等分;
      (2)对相邻的两个区域Ri和Rj,它们也可以大小不同(即不在同一层),如果条件H(RiURj)=TURE满足,就将它们合并起来;
      (3)如果进一步的分裂或合并都不可能,则结束。
      其中R代表整个正方形图像区域,P代表逻辑词。
      区域分裂合并算法优缺点:
      (1)对复杂图像分割效果好;
      (2)算法复杂,计算量大;
      (3)分裂有可能破怪区域的边界。
      在实际应用当中通常将区域生长算法和区域分裂合并算法结合使用,该类算法对某些复杂物体定义的复杂场景的分割或者对某些自然景物的分割等类似先验知识不足的图像分割效果较为理想。
      分水岭算法
      分水岭算法是一个非常好理解的算法,它根据分水岭的构成来考虑图像的分割,现实中我们可以想象成有山和湖的景象,那么一定是如下图的,水绕山山围水的景象。
      分水岭分割方法,是一种基于拓扑理论的数学形态学的分割方法,其基本思想是把图像看作是测地学上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每一个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭。分水岭的概念和形成可以通过模拟浸入过程来说明。在每一个局部极小值表面,刺穿一个小孔,然后把整个模型慢慢浸入水中,随着浸入的加深,每一个局部极小值的影响域慢慢向外扩展,在两个集水盆汇合处构筑大坝,即形成分水岭。
      分水岭对微弱边缘具有良好的响应,图像中的噪声、物体表面细微的灰度变化都有可能产生过度分割的现象,但是这也同时能够保证得到封闭连续边缘。同时,分水岭算法得到的封闭的集水盆也为分析图像的区域特征提供了可能。

    3.基于边缘检测的分割方法

    基于边缘检测的图像分割算法试图通过检测包含不同区域的边缘来解决分割问题。它可以说是人们最先想到也是研究最多的方法之一。通常不同区域的边界上像素的灰度值变化比较剧烈,如果将图片从空间域通过傅里叶变换到频率域,边缘就对应着高频部分,这是一种非常简单的边缘检测算法。
    边缘检测技术通常可以按照处理的技术分为串行边缘检测和并行边缘检测。串行边缘检测是要想确定当前像素点是否属于检测边缘上的一点,取决于先前像素的验证结果。并行边缘检测是一个像素点是否属于检测边缘高尚的一点取决于当前正在检测的像素点以及与该像素点的一些临近像素点。
    最简单的边缘检测方法是并行微分算子法,它利用相邻区域的像素值不连续的性质,采用一阶或者二阶导数来检测边缘点。近年来还提出了基于曲面拟合的方法、基于边界曲线拟合的方法、基于反应-扩散方程的方法、串行边界查找、基于变形模型的方法。

    边缘检测的优缺点:
    (1)边缘定位准确;
    (2)速度快;
    (3)不能保证边缘的连续性和封闭性;
    (4)在高细节区域存在大量的碎边缘,难以形成一个大区域,但是又不宜将高细节区域分成小碎片;
    由于上述的(3)(4)两个难点,边缘检测只能产生边缘点,而非完整意义上的图像分割过程。这也就是说,在边缘点信息获取到之后还需要后续的处理或者其他相关算法相结合才能完成分割任务。
    在以后的研究当中,用于提取初始边缘点的自适应阈值选取、用于图像的层次分割的更大区域的选取以及如何确认重要边缘以去除假边缘将变得非常重要。

    结合特定工具的图像分割算法

    基于小波分析和小波变换的图像分割方法

    小波变换是近年来得到的广泛应用的数学工具,也是现在数字图像处理必学部分,它在时间域和频率域上都有量高的局部化性质,能将时域和频域统一于一体来研究信号。而且小波变换具有多尺度特性,能够在不同尺度上对信号进行分析,因此在图像分割方面的得到了应用,
    二进小波变换具有检测二元函数的局部突变能力,因此可作为图像边缘检测工具。图像的边缘出现在图像局部灰度不连续处,对应于二进小波变换的模极大值点。通过检测小波变换模极大值点可以确定图像的边缘小波变换位于各个尺度上,而每个尺度上的小波变换都能提供一定的边缘信息,因此可进行多尺度边缘检测来得到比较理想的图像边缘。

    上图左图是传统的阈值分割方法,右边的图像就是利用小波变换的图像分割。可以看出右图分割得到的边缘更加准确和清晰
    另外,将小波和其他方法结合起来处理图像分割的问题也得到了广泛研究,比如一种局部自适应阈值法就是将Hilbert图像扫描和小波相结合,从而获得了连续光滑的阈值曲线。

    基于遗传算法的图像分割

    ​ 遗传算法(Genetic Algorithms,简称GA)是1973年由美国教授Holland提出的,是一种借鉴生物界自然选择和自然遗传机制的随机化搜索算法。是仿生学在数学领域的应用。其基本思想是,模拟由一些基因串控制的生物群体的进化过程,把该过程的原理应用到搜索算法中,以提高寻优的速度和质量。此算法的搜索过程不直接作用在变量上,而是在参数集进行了编码的个体,这使得遗传算法可直接对结构对象(图像)进行操作。整个搜索过程是从一组解迭代到另一组解,采用同时处理群体中多个个体的方法,降低了陷入局部最优解的可能性,并易于并行化。搜索过程采用概率的变迁规则来指导搜索方向,而不采用确定性搜索规则,而且对搜索空间没有任何特殊要求(如连通性、凸性等),只利用适应性信息,不需要导数等其他辅助信息,适应范围广。
    ​ 遗传算法擅长于全局搜索,但局部搜索能力不足,所以常把遗传算法和其他算法结合起来应用。将遗传算法运用到图像处理主要是考虑到遗传算法具有与问题领域无关且快速随机的搜索能力。其搜索从群体出发,具有潜在的并行性,可以进行多个个体的同时比较,能有效的加快图像处理的速度。但是遗传算法也有其缺点:搜索所使用的评价函数的设计、初始种群的选择有一定的依赖性等。要是能够结合一些启发算法进行改进且遗传算法的并行机制的潜力得到充分的利用,这是当前遗传算法在图像处理中的一个研究热点。

    基于主动轮廓模型的分割方法

    ​ 主动轮廓模型(active contours)是图像分割的一种重要方法,具有统一的开放式的描述形式,为图像分割技术的研究和创新提供了理想的框架。在实现主动轮廓模型时,可以灵活的选择约束力、初始轮廓和作用域等,以得到更佳的分割效果,所以主动轮廓模型方法受到越来越多的关注。
    ​ 该方法是在给定图像中利用曲线演化来检测目标的一类方法,基于此可以得到精确的边缘信息。其基本思想是,先定义初始曲线C,然后根据图像数据得到能量函数,通过最小化能量函数来引发曲线变化,使其向目标边缘逐渐逼近,最终找到目标边缘。这种动态逼近方法所求得的边缘曲线具有封闭、光滑等优点。

    ​ 传统的主动轮廓模型大致分为参数主动轮廓模型和几何主动轮廓模型。参数主动轮廓模型将曲线或曲面的形变以参数化形式表达,Kass等人提出了经典的参数活动轮廓模型即“Snake”模型,其中Snake定义为能量极小化的样条曲线,它在来自曲线自身的内力和来自图像数据的外力的共同作用下移动到感兴趣的边缘,内力用于约束曲线形状,而外力则引导曲线到特征此边缘。参数主动轮廓模型的特点是将初始曲线置于目标区域附近,无需人为设定曲线的的演化是收缩或膨胀,其优点是能够与模型直接进行交互,且模型表达紧凑,实现速度快;其缺点是难以处理模型拓扑结构的变化。比如曲线的合并或分裂等。而使用水平集(level set)的几何活动轮廓方法恰好解决了这一问题。

    基于深度学习的分割

    1.基于特征编码(feature encoder based)

    在特征提取领域中VGGnet和ResNet是两个非常有统治力的方法,接下来的一些篇幅会对这两个方法进行简短的介绍

    a.VGGNet

    ​ 由牛津大学计算机视觉组合和Google DeepMind公司研究员一起研发的深度卷积神经网络。它探索了卷积神经网络的深度和其性能之间的关系,通过反复的堆叠33的小型卷积核和22的最大池化层,成功的构建了16~19层深的卷积神经网络。VGGNet获得了ILSVRC 2014年比赛的亚军和定位项目的冠军,在top5上的错误率为7.5%。目前为止,VGGNet依然被用来提取图像的特征。

    ​ VGGNet的优缺点

    1. 由于参数量主要集中在最后的三个FC当中,所以网络加深并不会带来参数爆炸的问题;
    2. 多个小核卷积层的感受野等同于一个大核卷积层(三个3x3等同于一个7x7)但是参数量远少于大核卷积层而且非线性操作也多于后者,使得其学习能力较强
    3. VGG由于层数多而且最后的三个全连接层参数众多,导致其占用了更多的内存(140M)
    b.ResNet

    ​ 随着深度学习的应用,各种深度学习模型随之出现,虽然在每年都会出现性能更好的新模型,但是对于前人工作的提升却不是那么明显,其中有重要问题就是深度学习网络在堆叠到一定深度的时候会出现梯度消失的现象,导致误差升高效果变差,后向传播时无法将梯度反馈到前面的网络层,使得前方的网络层的参数难以更新,训练效果变差。这个时候ResNet恰好站出来,成为深度学习发展历程中一个重要的转折点。
    ​ ResNet是由微软研究院的Kaiming He等四名华人提出,他们通过自己提出的ResNet Unit成功训练出来152层的神经网络并在ILSVRC2015比赛中斩获冠军。ResNet语义分割领域最受欢迎且最广泛运用的神经网络.ResNet的核心思想就是在网络中引入恒等映射,允许原始输入信息直接传到后面的层中,在学习过程中可以只学习上一个网络输出的残差(F(x)),因此ResNet又叫做残差网络。、

    使用到ResNet的分割模型:

    • Efficient Neural Network(ENet):该网络类似于ResNet的bottleNeck方法;
    • ResNet-38:该网络在训练or测试阶段增加并移除了一些层,是一种浅层网络,它的结构是ResNet+FCN;
    • full-resolution residual network(FRRN):FRRN网络具有和ResNet相同优越的训练特性,它由残差流和池化流两个处理流组成;
    • AdapNey:根据ResNet-50的网络进行改进,让原本的ResNet网络能够在更短的时间内学习到更多高分辨率的特征;
      ……
      ResNet的优缺点:
      1)引入了全新的网络结构(残差学习模块),形成了新的网络结构,可以使网络尽可能地加深;
      2)使得前馈/反馈传播算法能够顺利进行,结构更加简单;
      3)恒等映射地增加基本上不会降低网络的性能;
      4)建设性地解决了网络训练的越深,误差升高,梯度消失越明显的问题;
      5)由于ResNet搭建的层数众多,所以需要的训练时间也比平常网络要长。

    2.基于区域选择(regional proposal based)

    Regional proposal 在计算机视觉领域是一个非常常用的算法,尤其是在目标检测领域。其核心思想就是检测颜色空间和相似矩阵,根据这些来检测待检测的区域。然后根据检测结果可以进行分类预测。
    在语义分割领域,基于区域选择的几个算法主要是由前人的有关于目标检测的工作渐渐延伸到语义分割的领域的,接下来小编将逐步介绍其个中关系。

    Stage Ⅰ: R-CNN

    伯克利大学的Girshick教授等人共同提出了首个在目标检测方向应用的深度学习模型:Region-based Convolutional Neural Network(R-CNN)。该网络模型如下图所示,其主要流程为:先使用selective search算法提取2000个候选框,然后通过卷积网络对候选框进行串行的特征提取,再根据提取的特征使用SVM对候选框进行分类预测,最后使用回归方法对区域框进行修正。

    R-CNN的优缺点:

    • 是首个开创性地将深度神经网络应用到目标检测的算法;
    • 使用Bounding Box Regression对目标检测的框进行调整;
    • 由于进行特征提取时是串行,处理耗时过长;
    • Selective search算法在提取每一个region时需要2s的时间,浪费大量时间
    Stage Ⅱ:Fast R-CNN

    ​ 由于R-CNN的效率太低,2015年由Ross等学者提出了它的改进版本:Fast R-CNN。其网络结构图如下图所示(从提取特征开始,略掉了region的选择)Fast R-CNN在传统的R-CNN模型上有所改进的地方是它是直接使用一个神经网络对整个图像进行特征提取,就省去了串行提取特征的时间;接着使用一个RoI Pooling Layer在全图的特征图上摘取每一个RoI对应的特征,再通过FC进行分类和包围框的修正。

    Fast R-CNN的优缺点

    • 节省了串行提取特征的时间;
    • 除了selective search以外的其它所有模块都可以合在一起训练;
    • 最耗时间的selective search算法依然存在。
    Stage Ⅲ:Faster R-CNN

    2016年提出的Faster R-CNN可以说有了突破性的进展(虽然还是目标检测哈哈哈),因为它改变了它的前辈们最耗时最致命的部位:selective search算法。它将selective search算法替换成为RPN,使用RPN网络进行region的选取,将2s的时间降低到10ms,其网络结构如下图所示:

    Faster R-CNN优缺点:

    • 使用RPN替换了耗时的selective search算法,对整个网络结构有了突破性的优化;
    • Faster R-CNN中使用的RPN和selective search比起来虽然速度更快,但是精度和selective search相比稍有不及,如果更注重速度而不是精度的话完全可以只使用RPN;
    Stage Ⅳ:Mask R-CNN

    Mask R-CNN(终于到分割了!)是何恺明大神团队提出的一个基于Faster R-CNN模型的一种新型的分割模型,此论文斩获ICCV 2017的最佳论文,在Mask R-CNN的工作中,它主要完成了三件事情:目标检测,目标分类,像素级分割。
    恺明大神是在Faster R-CNN的结构基础上加上了Mask预测分支,并且改良了ROI Pooling,提出了ROI Align。其网络结构真容就如下图所示啦:

    Mask R-CNN的优缺点:

    • 引入了预测用的Mask-Head,以像素到像素的方式来预测分割掩膜,并且效果很好;
    • 用ROI Align替代了ROI Pooling,去除了RoI Pooling的粗量化,使得提取的特征与输入良好对齐;
    • 分类框与预测掩膜共享评价函数,虽然大多数时间影响不大,但是有的时候会对分割结果有所干扰。
    Stage Ⅴ:Mask Scoring R-CNN

    最后要提出的是2019年CVPR的oral,来自华中科技大学的研究生黄钊金同学提出的
    MS R-CNN,这篇文章的提出主要是对上文所说的Mask R-CNN的一点点缺点进行了修正。他的网络结构也是在Mask R-CNN的网络基础上做了一点小小的改进,添加了Mask-IoU。
    黄同学在文章中提到:恺明大神的Mask R-CNN已经很好啦!但是有个小毛病,就是评价函数只对目标检测的候选框进行打分,而不是分割模板(就是上文提到的优缺点中最后一点),所以会出现分割模板效果很差但是打分很高的情况。所以黄同学增加了对模板进行打分的MaskIoU Head,并且最终的分割结果在COCO数据集上超越了恺明大神,下面就是MS R-CNN的网络结构啦~

    MS R-CNN的优缺点:

    • 优化了Mask R-CNN中的信息传播,提高了生成预测模板的质量;
    • 未经大批量训练的情况下,就拿下了COCO 2017挑战赛实例分割任务冠军;
    • 要说缺点的话。。应该就是整个网络有些庞大,一方面需要ResNet当作主干网络,另一方面需要其它各种Head共同承担各种任务。

    3.基于RNN的图像分割

    Recurrent neural networks(RNNs)除了在手写和语音识别上表现出色外,在解决计算机视觉的任务上也表现不俗,在本篇文章中我们就将要介绍RNN在2D图像处理上的一些应用,其中也包括介绍使用到它的结构或者思想的一些模型。
    RNN是由Long-Short-Term Memory(LSTM)块组成的网络,RNN来自序列数据的长期学习的能力以及随着序列保存记忆的能力使其在许多计算机视觉的任务中游刃有余,其中也包括语义分割以及数据标注的任务。接下来的部分我们将介绍几个使用到RNN结构的用于分割的网络结构模型:

    1.ReSeg模型

    ReSeg可能不被许多人所熟知,在百度上搜索出的相关说明与解析也不多,但是这是一个很有效的语义分割方法。众所周知,FCN可谓是图像分割领域的开山作,而RegNet的作者则在自己的文章中大胆的提出了FCN的不足:没有考虑到局部或者全局的上下文依赖关系,而在语义分割中这种依赖关系是非常有用的。所以在ReSeg中作者使用RNN去检索上下文信息,以此作为分割的一部分依据。

    该结构的核心就是Recurrent Layer,它由多个RNN组合在一起,捕获输入数据的局部和全局空间结构。
    优缺点:

    • 充分考虑了上下文信息关系;
    • 使用了中值频率平衡,它通过类的中位数(在训练集上计算)和每个类的频率之间的比值来重新加权类的预测。这就增加了低频率类的分数,这是一个更有噪声的分割掩码的代价,因为被低估的类的概率被高估了,并且可能导致在输出分割掩码中错误分类的像素增加。
    2.MDRNNs(Multi-Dimensional Recurrent Neural Networks)模型

    传统的RNN在一维序列学习问题上有着很好的表现,比如演讲(speech)和在线手写识别。但是 在多为问题中应用却并不到位。MDRNNs在一定程度上将RNN拓展到多维空间领域,使之在图像处理、视频处理等领域上也能有所表现。
    该论文的基本思想是:将单个递归连接替换为多个递归连接,相应可以在一定程度上解决时间随数据样本的增加呈指数增长的问题。以下就是该论文提出的两个前向反馈和反向反馈的算法。

    4.基于上采样/反卷积的分割方法

    卷积神经网络在进行采样的时候会丢失部分细节信息,这样的目的是得到更具特征的价值。但是这个过程是不可逆的,有的时候会导致后面进行操作的时候图像的分辨率太低,出现细节丢失等问题。因此我们通过上采样在一定程度上可以不全一些丢失的信息,从而得到更加准确的分割边界。
    接下来介绍几个非常著名的分割模型:

    a.FCN(Fully Convolutional Network)

    是的!讲来讲去终于讲到这位大佬了,FCN!在图像分割领域已然成为一个业界标杆,大多数的分割方法多多少少都会利用到FCN或者其中的一部分,比如前面我们讲过的Mask R-CNN。
    在FCN当中的反卷积-升采样结构中,图片会先进性上采样(扩大像素);再进行卷积——通过学习获得权值。FCN的网络结构如下图所示:

    当然最后我们还是需要分析一下FCN,不能无脑吹啦~
    优缺点:

    • FCN对图像进行了像素级的分类,从而解决了语义级别的图像分割问题;
    • FCN可以接受任意尺寸的输入图像,可以保留下原始输入图像中的空间信息;
    • 得到的结果由于上采样的原因比较模糊和平滑,对图像中的细节不敏感;
    • 对各个像素分别进行分类,没有充分考虑像素与像素的关系,缺乏空间一致性。
    2.SetNet

    SegNet是剑桥提出的旨在解决自动驾驶或者智能机器人的图像语义分割深度网络,SegNet基于FCN,与FCN的思路十分相似,只是其编码-解码器和FCN的稍有不同,其解码器中使用去池化对特征图进行上采样,并在分各种保持高频细节的完整性;而编码器不使用全连接层,因此是拥有较少参数的轻量级网络:

    图像分割是计算机视觉研究中的一个经典难题,已经成为图像理解领域关注的一个热点,图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的说就是在一副图像中,把目标从背景中分离出来。对于灰度图像来说,区域内部的像素一般具有灰度相似性,而在区域的边界上一般具有灰度不连续性。 关于图像分割技术,由于问题本身的重要性和困难性,从20世纪70年代起图像分割问题就吸引了很多研究人员为之付出了巨大的努力。虽然到目前为止,还不存在一个通用的完美的图像分割的方法,但是对于图像分割的一般性规律则基本上已经达成的共识,已经产生了相当多的研究成果和方法。

    本文对于目前正在使用的各种图像分割方法进行了一定的归纳总结,由于笔者对于图像分割的了解也是初窥门径,所以难免会有一些错误,还望各位读者多多指正,共同学习进步。

    SetNet的优缺点:

    • 保存了高频部分的完整性;
    • 网络不笨重,参数少,较为轻便;
    • 对于分类的边界位置置信度较低;
    • 对于难以分辨的类别,例如人与自行车,两者如果有相互重叠,不确定性会增加。
      以上两种网络结构就是基于反卷积/上采样的分割方法,当然其中最最最重要的就是FCN了,哪怕是后面大名鼎鼎的SegNet也是基于FCN架构的,而且FCN可谓是语义分割领域中开创级别的网络结构,所以虽然这个部分虽然只有两个网络结构,但是这两位可都是重量级嘉宾,希望各位能够深刻理解~

    5.基于提高特征分辨率的分割方法

    在这一个模块中我们主要给大家介绍一下基于提升特征分辨率的图像分割的方法。换一种说法其实可以说是恢复在深度卷积神经网络中下降的分辨率,从而获取更多的上下文信息。这一系列我将给大家介绍的是Google提出的DeepLab 。
    DeepLab是结合了深度卷积神经网络和概率图模型的方法,应用在语义分割的任务上,目的是做逐像素分类,其先进性体现在DenseCRFs(概率图模型)和DCNN的结合。是将每个像素视为CRF节点,利用远程依赖关系并使用CRF推理直接优化DCNN的损失函数。
    在图像分割领域,FCN的一个众所周知的操作就是平滑以后再填充,就是先进行卷积再进行pooling,这样在降低图像尺寸的同时增大感受野,但是在先减小图片尺寸(卷积)再增大尺寸(上采样)的过程中一定有一些信息损失掉了,所以这里就有可以提高的空间。
    接下来我要介绍的是DeepLab网络的一大亮点:Dilated/Atrous Convolution,它使用的采样方式是带有空洞的采样。在VGG16中使用不同采样率的空洞卷积,可以明确控制网络的感受野。

    图a对应3x3的1-dilated conv,它和普通的卷积操作是相同的;图b对应3x3的2-dilated conv,事迹卷积核的尺寸还是3x3(红点),但是空洞为1,其感受野能够达到7x7;图c对应3x3的4-dilated conv,其感受野已经达到了15x15.写到这里相信大家已经明白,在使用空洞卷积的情况下,加大了感受野,使每个卷积输出都包含了较大范围的信息。
    这样就解决了DCNN的几个关于分辨率的问题:
    1)内部数据结构丢失;空间曾计划信息丢失;
    2)小物体信息无法重建;
    当然空洞卷积也存在一定的问题,它的问题主要体现在以下两方面:
    1)网格效应
    加入我们仅仅多次叠加dilation rate 2的 3x3 的卷积核则会出现以下问题

    我们发现卷积核并不连续,也就是说并不是所有的像素都用来计算了,这样会丧失信息的连续性;
    2)小物体信息处理不当
    我们从空洞卷积的设计背景来看可以推测出它是设计来获取long-ranged information。然而空洞步频选取得大获取只有利于大物体得分割,而对于小物体的分割可能并没有好处。所以如何处理好不同大小物体之间的关系也是设计好空洞卷积网络的关键。

    6.基于特征增强的分割方法

    基于特征增强的分割方法包括:提取多尺度特征或者从一系列嵌套的区域中提取特征。在图像分割的深度网络中,CNN经常应用在图像的小方块上,通常称为以每个像素为中心的固定大小的卷积核,通过观察其周围的小区域来标记每个像素的分类。在图像分割领域,能够覆盖到更大部分的上下文信息的深度网络通常在分割的结果上更加出色,当然这也伴随着更高的计算代价。多尺度特征提取的方法就由此引进。
    在这一模块中我先给大家介绍一个叫做SLIC,全称为simple linear iterative cluster的生成超像素的算法。
    首先我们要明确一个概念:啥是超像素?其实这个比较容易理解,就像上面说的“小方块”一样,我们平常处理图像的最小单位就是像素了,这就是像素级(pixel-level);而把像素级的图像划分成为区域级(district-level)的图像,把区域当成是最基本的处理单元,这就是超像素啦。
    算法大致思想是这样的,将图像从RGB颜色空间转换到CIE-Lab颜色空间,对应每个像素的(L,a,b)颜色值和(x,y)坐标组成一个5维向量V[l, a, b, x, y],两个像素的相似性即可由它们的向量距离来度量,距离越大,相似性越小。
    算法首先生成K个种子点,然后在每个种子点的周围空间里搜索距离该种子点最近的若干像素,将他们归为与该种子点一类,直到所有像素点都归类完毕。然后计算这K个超像素里所有像素点的平均向量值,重新得到K个聚类中心,然后再以这K个中心去搜索其周围与其最为相似的若干像素,所有像素都归类完后重新得到K个超像素,更新聚类中心,再次迭代,如此反复直到收敛。
    有点像聚类的K-Means算法,最终会得到K个超像素。
    Mostahabi等人提出的一种前向传播的分类方法叫做Zoom-Out就使用了SLIC的算法,它从多个不同的级别提取特征:局部级别:超像素本身;远距离级别:能够包好整个目标的区域;全局级别:整个场景。这样综合考虑多尺度的特征对于像素或者超像素的分类以及分割来说都是很有意义的。
    接下来的部分我将给大家介绍另一种完整的分割网络:PSPNet:Pyramid Scene Parsing Network
    论文提出在场景分割是,大多数的模型会使用FCN的架构,但是FCN在场景之间的关系和全局信息的处理能力存在问题,其典型问题有:1.上下文推断能力不强;2.标签之间的关系处理不好;3.模型可能会忽略小的东西。
    本文提出了一个具有层次全局优先级,包含不同子区域时间的不同尺度的信息,称之为金字塔池化模块。
    该模块融合了4种不同金字塔尺度的特征,第一行红色是最粗糙的特征–全局池化生成单个bin输出,后面三行是不同尺度的池化特征。为了保证全局特征的权重,如果金字塔共有N个级别,则在每个级别后使用1×1 1×11×1的卷积将对于级别通道降为原本的1/N。再通过双线性插值获得未池化前的大小,最终concat到一起。其结构如下图:

    最终结果就是,在融合不同尺度的feature后,达到了语义和细节的融合,模型的性能表现提升很大,作者在很多数据集上都做过训练,最终结果是在MS-COCO数据集上预训练过的效果最好。

    为了捕捉多尺度特征,高层特征包含了更多的语义和更少的位置信息。结合多分辨率图像和多尺度特征描述符的优点,在不丢失分辨率的情况下提取图像中的全局和局部信息,这样就能在一定程度上提升网络的性能。

    7.使用CRF/MRF的方法

    首先让我们熟悉熟悉到底啥是MRF的CRF的。
    MRF全称是Marcov Random Field,马尔可夫随机场,其实说起来笔者在刚读硕士的时候有一次就有同学在汇报中提到了隐马尔可夫、马尔可夫链啥的,当时还啥都不懂,小白一枚(现在是准小白hiahia),觉得马尔可夫这个名字贼帅,后来才慢慢了解什么马尔科夫链呀,马尔可夫随机场,并且在接触到图像分割了以后就对马尔科夫随机场有了更多的了解。
    MRF其实是一种基于统计的图像分割算法,马尔可夫模型是指一组事件的集合,在这个集合中,事件逐个发生,并且下一刻事件的发生只由当前发生的事件决定,而与再之前的状态没有关系。而马尔可夫随机场,就是具有马尔可夫模型特性的随机场,就是场中任何区域都只与其临近区域相关,与其他地方的区域无关,那么这些区域里元素(图像中可以是像素)的集合就是一个马尔可夫随机场。
    CRF的全称是Conditional Random Field,条件随机场其实是一种特殊的马尔可夫随机场,只不过是它是一种给定了一组输入随机变量X的条件下另一组输出随机变量Y的马尔可夫随机场,它的特点是埃及设输出随机变量构成马尔可夫随机场,可以看作是最大熵马尔可夫模型在标注问题上的推广。
    在图像分割领域,运用CRF比较出名的一个模型就是全连接条件随机场(DenseCRF),接下来我们将花费一些篇幅来简单介绍一下。
    CRF在运行中会有一个问题就是它只对相邻节点进行操作,这样会损失一些上下文信息,而全连接条件随机场是对所有节点进行操作,这样就能获取尽可能多的临近点信息,从而获得更加精准的分割结果。
    在Fully connected CRF中,吉布斯能量可以写作:

    我们重点关注二元部分:

    其中k(m)为高斯核,写作:

    该模型的一元势能包含了图像的形状,纹理,颜色和位置,二元势能使用了对比度敏感的的双核势能,CRF的二元势函数一般是描述像素点与像素点之间的关系,鼓励相似像素分配相同的标签,而相差较大的像素分配不同标签,而这个“距离”的定义与颜色值和实际相对距离有关,这样CRF能够使图像尽量在边界处分割。全连接CRF模型的不同就在于其二元势函数描述的是每一个像素与其他所有像素的关系,使用该模型在图像中的所有像素对上建立点对势能从而实现极大地细化和分割。
    在分割结果上我们可以看看如下的结果图:

    可以看到它在精细边缘的分割比平常的分割方法要出色得多,而且文章中使用了另一种优化算法,使得本来需要及其大量运算的全连接条件随机场也能在很短的时间里给出不错的分割结果。
    至于其优缺点,我觉得可以总结为以下几方面:

    • 在精细部位的分割非常优秀;
    • 充分考虑了像素点或者图片区域之间的上下文关系;
    • 在粗略的分割中可能会消耗不必要的算力;
    • 可以用来恢复细致的局部结构,但是相应的需要较高的代价。
      OK,那么本次的推送就到这里结束啦,本文的主要内容是对图像分割的算法进行一个简单的分类和介绍。综述对于各位想要深入研究的看官是非常非常重要的资源:大佬们经常看综述一方面可以了解算法的不足并在此基础上做出改进;萌新们可以通过阅读一篇好的综述入门某一个学科,比如今天的内容就是图像分割。
      谢谢各位朋友们的观看!

    推荐阅读

    如何从零开始系统化学习视觉SLAM?
    从零开始一起学习SLAM | 为什么要学SLAM?
    从零开始一起学习SLAM | 学习SLAM到底需要学什么?
    从零开始一起学习SLAM | SLAM有什么用?
    从零开始一起学习SLAM | C++新特性要不要学?
    从零开始一起学习SLAM | 为什么要用齐次坐标?
    从零开始一起学习SLAM | 三维空间刚体的旋转
    从零开始一起学习SLAM | 为啥需要李群与李代数?
    从零开始一起学习SLAM | 相机成像模型
    从零开始一起学习SLAM | 不推公式,如何真正理解对极约束?
    从零开始一起学习SLAM | 神奇的单应矩阵
    从零开始一起学习SLAM | 你好,点云
    从零开始一起学习SLAM | 给点云加个滤网
    从零开始一起学习SLAM | 点云平滑法线估计
    从零开始一起学习SLAM | 点云到网格的进化
    从零开始一起学习SLAM | 理解图优化,一步步带你看懂g2o代码
    从零开始一起学习SLAM | 掌握g2o顶点编程套路
    从零开始一起学习SLAM | 掌握g2o边的代码套路
    零基础小白,如何入门计算机视觉?
    SLAM领域牛人、牛实验室、牛研究成果梳理
    我用MATLAB撸了一个2D LiDAR SLAM
    可视化理解四元数,愿你不再掉头发
    最近一年语义SLAM有哪些代表性工作?
    视觉SLAM技术综述
    汇总 | VIO、激光SLAM相关论文分类集锦
    研究SLAM,对编程的要求有多高?
    2018年SLAM、三维视觉方向求职经验分享
    2018年SLAM、三维视觉方向求职经验分享
    深度学习遇到SLAM | 如何评价基于深度学习的DeepVO,VINet,VidLoc?
    视觉SLAM关键方法总结
    SLAM方向公众号、知乎、博客上有哪些大V可以关注?
    SLAM实验室
    SLAM方向国内有哪些优秀公司?
    SLAM面试常见问题
    SLAM相关领域数据集调研
    从零开始一起学习SALM-ICP原理及应用
    解放双手——相机与IMU外参的在线标定
    目标检测

    展开全文
  • 光谱仪: “描绘”首与尾反应历程 化学反应是一个比较复杂的过程,常常伴随着多种副反应的发生,且反应过程中常生成多种中间产物,这给科研人员的研究带来很大的工作量。现下,光谱仪和色谱仪是实时监测化学反应最...

    bfd0291168ea97f4ba2396ab707c18b3.png

    在新材料的研发制备过程中,观察其形成的完整化学试验过程至关重要。无论是中间过程形成的不稳定的化合物还是最终试验形成的“备胎”产物,都有研究价值。

    对化学过程中的宏观和微观变量进行动态监测,能对反应进程与终点进行合理调控与确认,从而达到合成目标产物的目的。在研制新材料的过程中,比如新有机化合物的合成,会有各种各样的碳碳键组合方式,但在碳碳键的组合过程中有些变化就可逆,有些碳碳键组合就很稳定,如果能够在微观层面进行监测研究,就能够深入触达到化学反应合成过程的核心。

    但是在一些化合物的制备过程中,一些活跃的化学反应除了其开始原料和最终产物表现稳定,但中间的反应过程剧烈化合物极其多变,了解和观测非常困难。

    近日英国剑桥大学一个团队制造了一个强大的工具——纳米相机,用以实时观测一些化学反应中间的过程。

    3b7ca29593ce7d85ea17d5404d8876a5.png

    分子级实时监测,

    理论产物无处遁形

    这个微型照相机,是用叫作瓜胶(CB)的“分子胶”将微小的半导体纳米晶体和金纳米颗粒结合起来,在研究某个化学反应的时候,将其放入待研究的分子反应溶液中,这些成分在水里几秒钟自我组装成为一个稳定的强大的工具,监控化学反应。

    6329c0d9e73d03cea2e5576b6f1ae54c.png

    这个被包围的小纳米相机中的半导体会观察光催化和跟踪光诱导的电子转移,类似于光合作用中的电子转移过程,而这个收集光电子的过程会被金纳米粒子传感器和光谱技术进行监测。

    与此前的试验相比,科研人员可以用纳米相机观察到此前只存在理论研究中的化合物。新型纳米相机打开了化学反应过程中的化合物世界,未来这种材料可以用于研究一些功能丰富的潜在化合物,比如改善光催化和光伏可再生能源。

    在实际的科研中,研究团队分享为了开发新材料,经常需要将不同的化学物质组合在一起。想要得到性能优良的混合纳米材料是很困难的,大部分的试验最终会不受控制或得到一些性质不稳定的材料。研究人员通过他们创造的界面自限聚集过程来控制这些纳米粒子的组装,该过程会产生与光相互作用的可渗透且稳定的混合材料。

    在分子层面,大自然中各种化合物通过自身的化学性质限制一些复杂结构的集合生成,在实验室中去模拟这些化学全生命过程是非常困难,耗时长、成本贵,甚至有些化合物的生成无法通过检测仪器监测观察。

    这个新型的纳米相机组装非常简单,但功能又非常强大,结构稳定可以保持数周。连接粒子和半导体的瓜胶,与半导体纳米晶体和金纳米粒子都有强烈相互作用,以前,在没有量子点的情况下,当金纳米粒子与分子胶混合时,其组分会无限聚集并从溶液中脱落。新开发的策略,使得这些纳米结构的组装过程互相制约,半导体-金属混合材料会在试验的过程中限制自己的大小和形状。

    dd81b3900cd107317d907cb87790918e.png

    当研究人员将纳米相机运用在试验中,使用光谱学仪器实时监测化学反应,他们能够观察自由基种类的形成以及它们组合的产物,如其中两个自由基形成可逆的碳碳键,这个自由基以前都是停留在理论推导的过程,但从未被观察到。

    研究人员称纳米相机提供了同时诱导和观察光化学反应的机会,半导体和电浆子纳米晶体的全部潜力现在可以被探索。它为化学反应成像和通过对监测的化学系统进行快照打开了许多新的可能性。

    简单的设置让研究人员告别了以前复杂、昂贵的方法来获得相同的结果。据悉,这个平台将开启一系列广泛的试验,包括许多对可持续技术至关重要的材料如电池应用的电极界面和碳碳键形成的机制等。

    光谱仪:

    “描绘”首与尾反应历程

    9d1a03648a6657cffc6dd2e28c8ff9f4.png

    化学反应是一个比较复杂的过程,常常伴随着多种副反应的发生,且反应过程中常生成多种中间产物,这给科研人员的研究带来很大的工作量。现下,光谱仪和色谱仪是实时监测化学反应最常用的方式,可以对一些有机化学反应过程进行记录,以揭示化学反应发生的微观机理、反应历程等。

    在有机分析科学领域,科研人员运用光谱仪和色谱仪对反应进程和终点进行合理调控,通过研究反应体系中反应物、中间体和产物来推断有机反应机理,调控有机反应进程,最终实现提高反应的转化率以及产物质量的效果。

    比如可以通过观察反应物和产物随时间的变化提高反应的区域选择性,从而优化反应,也可以在药物生产中阻止将可能改变其药理活性反应的发生,排除和避免副反应的发生等。

    对于一些新兴材料领域的研究,已有的反应监测方法可能会滞后合成化学的发展,就需要懂痛点与技术的科研人员自主进行新方法的研究,更新实时监测技术。新型纳米相机就是一个很好的拓展研究例子,利用技术发展中的纳米技术方法,将微观层面的反应变化能够实时监测,对科研人员的化学实验过程研究带来了很大的帮助。

    e3cb20817879ceef20d1470dbaf936ae.png

    我们使用的每种新合成材料,合成药物等,都是经过科研工作者的千百次试验才能得到,微小的发明进步对于行外人来说就是看热闹,无法感同身受那种变化与喜悦,而对于行内人来说就是工作、研究质的飞跃。拿生命科学领域的爆炸性新闻来说,DeepMind 的Al phaFold2模型,几乎将人类的98.5%的蛋白质全部预测了一遍,科研人员在此基础上可以愉快地深入探索蛋白质中的生命密码,但是行业外的人根本无法get到Al phaFold2模型工具究竟为蛋白质的研究带来了什么。

    回到纳米相机的研究中,新型的纳米相机在化学反应的微观层面上可以获取光催化和跟踪光诱导电子转移的过程,革新了以前只存在理论中的化合产物事实,研究人员只需要简单地操作就可以完成这个微观层面的深入观察。而长远来看,这个纳米相机对新型化合物的发现覆盖领域巨大,有点像开盲盒,一个微小的技术变化背后,你不知道会因为它而在未来打开什么新惊喜。在新型化合物的制备过程中,科研研究与创新技术一直都是螺旋同步增长的发展过程,研究不止,配套的革新技术就会不止,两者同向而生,生生不息。

    21903d4472174da6b82addf91b0d2e5f.gif

    展开全文
  • 初识人工智能——人工智能的冷落与兴起

    万次阅读 多人点赞 2018-11-14 21:42:41
    什么是人工智能?可能是大家一开始最想了解的。 大家看图中关于人工智能的定义。通俗点来说呢,就是 让机器实现原来只有人类才能完成的任务;比如看懂照片,听懂说话,思考等等。 那现在耳熟能详的机器学习,深度...
  • 糖酵解的反应过程

    千次阅读 2019-10-01 16:47:01
    整个糖酵解途径由两个阶段十个反应组成:(1)引发阶段,共五步反应,一分子葡萄糖经过1,6-二磷酸果糖转变成2分子3-磷酸甘油醛,共消耗2分子ATP(投资阶段)。(2)产能阶段,共五步反应,二分子3-磷酸甘油醛最终...
  • 恩智浦智能汽车竞赛电磁组总结

    万次阅读 多人点赞 2020-03-03 11:31:04
    大家无论选择什么组,在画板子是一定要加上LED 屏,因为加了屏幕,在以后的调试中真的可以起到很大的作用,节约很多时间,还有电磁组画传感器的时候,尽量画8个,最少6个,你多画几个就算不用也没事,万一以后用也不...
  • SDN

    千次阅读 多人点赞 2017-06-29 11:35:37
    究竟什么是软件定义网络? SDN是一种简化网络的方法 和 体系架构,使得 网络对其工作负载和服务的要求更具有反应性,从中也可以窥探出未来网络的发展趋向:走向智能化。 SDN提供一种功能:使得网络能够被...
  • 采用B3LYP,MP2方法在6-311++G(2df,pd)水平上,研究了酸性催化剂条件下甲醇气相脱水合成二甲醚反应的微观机理,找到了可能的反应通道,并得到了各反应通道的反应物、中间体、过渡态和产物的优化构型、谐振频率,...
  • 现在大家应该知道到底什么是云计算了。 而现阶段 所说的云计算, 已经不单单 是一种分布式计算,而是分布式 计算、 效用计算、负载均衡、并 行计算、网络存储、热备份冗 杂和虚拟化等计算机技术混合演进并跃升的结果...
  • 二:反应历程与基元反应: 1: 概念:反应物转化为生成物的途径称为反应历程。 基元反应:指反应物分子直接碰撞发生作用而生成产物的反应。即一步完成的反应。 也就是大多数化学反应都要经历若干个基元反应才能转化...
  • 面试历程

    2019-01-14 14:47:09
    前不久收获了在上海的第一份工作,本人大学在河南上的,毕业后几经思考,决定来上海工作,之前是自学的python,那么开始讲讲来到上海之后的面试历程。 首先是广投简历,我的话每天是投几十份吧,各大招聘网站上,像...
  • 工业控制系统发展历程

    千次阅读 2020-07-29 10:55:37
    由于远程终端单元是在连续扫描且须快速反应的工作状态中进行操作,其通讯协议必须兼具高效与安全,且安全是重中之重,所以早期的远程控制单元供应商所使用的协议各不相同,各供应商的系统完全无法兼容。在国际电气与...
  • 我的英语学习历程

    2019-12-25 18:41:42
           好久没写记事的博客,一晃今年就要结束了。时间不会等人,新的2020年似乎来得那么快。...一年又一年过去,今年有什么自我突破和挑战呢?我想,今年最大的挑...
  • 以氢氧化锂、磷酸二氢铵和醋酸钴为原料,首先经低热固相反应合成得到前驱体...Li3PO4和LiCoPO4、Co22P2O7经历了不同的反应历程:Li3PO4转化反应遵循指数成核反应机理,活化能为41.8 kJ・mol-1,是固相反应的控制步骤:
  • 嵌入式操作系统的发展历程

    千次阅读 2019-09-08 12:37:47
    而一般的桌面操作系统基本上是根据人在键盘和鼠标发出的命令进行工作,人的动作和反应在时序上并不很严格。比如,用于控制火箭发动机的嵌入式系统,它所发出的指令不仅要求速度快,而且多个发动机之间的时序要求非常...
  • 基于甲醇氧化的详细反应历程,利用敏感性分析的方法,提出了一个用于描述甲醇空气预混层流燃烧速度的包含18种组分、28步基元反应的简化化学反应动力学机理。研究发现,在甲醇的氧化过程中,甲醇的分解反应及H、OH等...
  • 无创血糖仪的发展历程

    千次阅读 2019-08-16 16:03:49
    电化学法技术开始于1981年,到1986年Medisense(雅培)公司开发了第一台电化学法血糖仪ExactechPen ,电化学法血糖仪采用检测反应过程中产生的电流信号的原理来反应血糖值。电子感应原理不会因强光环境下操作受到...
  • 阿里云发展历程2.阿里云技术架构3.地域和可用区三、云端实践1.杭州城市大脑2.12306网站3.天弘基金与余额宝 一、初识阿里云 1.概述 阿里云,阿里巴巴集团旗下云计算品牌,全球卓越的云计算技术和服务提供商(云计算...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 9,854
精华内容 3,941
关键字:

反应历程是什么