精华内容
下载资源
问答
  • 一代、二代、三代测序技术简要原理及比较1.一代测序2.二代测序3.三代测序3.1.Oxford Nanopore公司:[纳米孔测序技术]3.2.Pacific Bioscience公司:[单分子实时荧光测序技术SMRT]4.一代、二代、三代测序技术的比较: ...

    1.一代测序

    一代测序需要提及一名科学家Frederick Sanger ,Sanger是一位1918年出生于美国的生物化学家,曾经两度获得诺贝尔化学奖 。上世纪70年代末,他提出快速测定脱氧核糖核酸(DNA)序列的技术“双脱氧终止法”,也被称作“Sanger法测序技术,一代测序为合成终止测序

    1.1 Sanger测序

    Sanger测序:双脱氧链终止法:采用DNA复制原理。Sanger测序反应体系中包括目标DNA片段、脱氧三磷酸核苷酸(dNTP)、双脱氧三磷酸核苷酸(ddNTP)、测序引物及DNA聚合酶等。其技术核心是ddNTP的使用,由于缺少3’-OH基团,不具有与另一个dNTP连接形成磷酸二酯键的能力,这些ddNTP可用来中止DNA链的延伸。此外,这些ddNTP上连接有放射性同位素或荧光标记基团,因此可以被自动化的仪器或凝胶成像系统所检测到。
    在这里插入图片描述

    2.二代测序

    2005年,罗氏推出了第一款二代测序仪罗氏454,生命科学开始进入高通量测序时代。后续随着Illumina系列测序平台的推出,极大降低了二代测序的价格,推动了高通量测序在生命科学各个研究领域的普及。目前,高通量测序已经成为一种常规研究方法,大量科研工作中均会用到。然而,为什么二代测序能实现高通量?为什么二代测序读长如此之短?为什么reads末端测序质量会降低?应该如何选择测序读长与打断片段的长度?想要回答这些问题,都需要详细了解二代测序的基本原理。

    2.1.Illumina Solexa合成测序

    使用克隆单分子阵列技术。首先将目的DNA片段打断成100-200bp,随机连接到固相基质上,经过Bst 聚合酶延伸和甲酸胺变性的桥PCR循环,生成大量的 DNA簇,之后的反应与Sanger法类似,每次延伸所产生的光信号被标准的阵列光学检测系统分析测序,下一次循环中把终止剂和荧光标记基团裂解掉,然后继续延伸 dNTP,实现了边合成边测序技术。
    在这里插入图片描述
    illumina测序基本步骤
    1. 文库制备

    将基因组DNA打成几百个碱基(或更短)的小片段,在片段的两个末端加上接头(adapter)。

    2. 产生DNA簇

    利用专利的芯片,其表面连接有一层单链引物,DNA片段变成单链后通过与芯片表面的引物碱基互补被一端“固定”在芯片上。另外一端(5’或3’)随机和附近的另外一个引物互补,也被“固定”住,形成“桥 (bridge) “。反复30轮扩增,每个单分子得到了1000倍扩增,成为单克隆DNA簇。DNA簇产生之后,扩增子被线性化,测序引物随后杂交在目标区域一侧的通用序列上。

    3. 边合成边测序

    Genome Analyzer系统应用了边合成边测序(Sequencing By Synthesis)的原理。加入改造过的DNA聚合酶和带有4种荧光标记的dNTP。 这些核苷酸是“可逆终止子”,因为3’羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3’端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。目前的配对末端读长可达到2×50 bp,更长的读长也能实现,但错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。=

    4. 数据分析
    自动读取碱基,数据被转移到自动分析通道进行二次分析

    2.2.Roche 454焦磷酸测序

    使用边合成边测序技术,避免了Sanger法存在的宿主菌克隆问题。即首先将目的DNA片段打断成300-800bp的小片段,然后在5’端加上一个磷酸基团,并将3’端变成平端,再在两端加上衔接子组成目的DNA的样品文库。之后将目的DNA片段固定到磁珠上,将磁珠包被在单个油水混合小滴中进行独立的扩增,从而实现所有目的DNA片段进行平行扩增PCR。随后将这些DNA放入PCT反应板中共进行后继测序,这里面包含了化学光反应所需的各种酶和底物。测序开始时,将T、A、G、C按顺序循环单分子进入PTP 板,如果发生配对,则会释放一个焦磷酸盐分子,其在后续与ATP磷酸化酶和虫荧光素反应产生光信号,此光信号被捕获以确定碱基序列。

    2.3.ABI SOLiD连接法测序

    首先制备DNA文库,可以使用片段文库和配对末端文库。第二阶段与焦磷酸测序相同,加入磁珠等反应元件进行emPCR平行扩增,,不同的是该方法的磁珠只有1 µm。在连接测序中,底物是 8 个碱基的八聚体单链荧光探针,在5′末端分别标记了CY5、Teaxs Red、CY3、6-FAM这四种颜色的荧光染料。3′ 端的第 1、2 位碱基类别排序分别对应着一个固定的荧光染料,第 3、4、5 位碱基“n”是随机碱基,第 6、7、8 位碱基“z”是可以和任何碱基配对的特殊碱基。一次测序中包括了五轮连接反应,可以减小测序误差

    2.4.BGI(华大基因):纳米球测序

    1.BGI采用了 联合探针锚定聚合技术(cPAS)和改进的DNA纳米球(DNB)核心测序技术;
    2. 单链DNA会缠绕成一个纳米球,纳米球可自动附着于有整齐的固定点的芯片上而不相互堆叠(即阵列技术),随后利用组合探针锚定连接法测序。

    整个过程包含样本准备(形成末端修复的DNA片段)、片段扩增(加接头序列、形成单链DNA、成环、滚环扩增形成DNA纳米球)、纳米球附着于芯片并使用cPAS法测序。具体原理参见文献:Science 327, 78 (2010)

    3.三代测序

    第三代测序技术是指单分子测序技术,DNA测序时,不需要经过PCR扩增,实现了对每一条DNA分子的单独测序。第三代测序技术也叫从头测序技术,即单分子实时DNA测序,主要可以分为单分子荧光测序纳米孔测序

    3.1.Oxford Nanopore公司:[纳米孔测序技术]

    在这里插入图片描述

    1. 英国牛津纳米孔公司 新型纳米孔测序法(nanopore sequencing)是采用电泳技术,借助电泳驱动单个分子逐一通过纳米孔 来实现测序的。由于纳米孔的直径非常细小,仅允许单个核酸聚合物通过,四种核苷酸的空间构象不一样,因此当它们通过纳米孔时,所引起的电流变化不一样。由多个核苷酸组成的DNA或RNA链通过纳米孔时,检测通过纳米孔电流的强度变化,即可判断通过的核苷酸类型,从而进行实时测序。

    3.2.Pacific Bioscience公司:[单分子实时荧光测序技术SMRT]

    在这里插入图片描述

    1. Pacific Bioscience公司(太平洋生物公司):SingleMolecule Real Time(SMRT)测序其通过将脱氧核苷酸用荧光标记,实时地记录荧光的强度变化。当荧光基团被掺入DNA链的时候,它的荧光就同时能在DNA链上探测到。当它与DNA链形成化学键的时候,它的荧光基团就被DNA聚合酶切除,荧光消失。这种荧光标记的脱氧核苷酸不会影响DNA聚合酶的活性,并且在荧光被切除之后,合成的DNA链和天然的DNA链完全一样。测序过程包括文库构建和上机两步。文库构建是将长片段DNA分子与测序接头连接成茎环结构,然后加上与接头互补的测序引物及DNA聚合酶。上机测序是将构建好的文库复合物载入SMRT Cell的纳米孔中,通常一个纳米孔固定一个DNA分子,DNA聚合酶通过共价连接的方式固定在纳米孔底部。

    3.3 GenoCare:我国乃至全亚洲第一台单分子荧光测序(三代测序仪)

    GenoCare第三代基因测序仪

    贺建奎教授团队研发成功第三代基因测序仪GenoCare,是当今世界上准确率最高(准确率达99.9985%)的第三代测序仪,并且率先在全世界取得政府医疗器械证备案、初步实现产业化并已应用于临床检测。该测序仪开发出基于全内反射先进光学的技术,可检测到单个DNA分子的微弱信号,读取DNA序列编码,为健康和疾病提供解读和诊断信息,其技术水平在亚洲乃至世界都居于领先地位

    4.一代、二代、三代测序技术的比较:

    4.1 一代、二代测序的区别:

    • 一代:准确性高(~0.1%ER)、读长较长(约1kb)、通量低、价格昂贵。
    • 二代:准确性较高(1~1.5%ER)、读长较长(150-600bp)、通量高、价格便宜。
      一代测序为合成终止测序,而二代测序开创性的引入了可逆终止末端,从而实现边合成边测序(Sequencing by Synthesis)。二代测序在DNA复制过程中通过捕捉新添加的碱基所携带的特殊标记(一般为荧光分子标记)来确定DNA的序列,现有的技术平台主要包括Roche的454 FLX、Illumina的Miseq/Hiseq等。由于在二代测序中,单个DNA分子必须扩增成由相同DNA组成的基因簇,然后进行同步复制,来增强荧光信号强度从而读出DNA序列;而随着读长增长,基因簇复制的协同性降低,导致碱基测序质量下降,这严格限制了二代测序的读长(不超过500bp),因此,二代测序具有通量高、读长短的特点。二代测序适合扩增子测序(例如16S、18S、ITS的可变区),而基因组、宏基因组DNA则需要使用鸟枪法(Shotgun method)打断成小片段,测序完毕后再使用生物信息学方法进行拼接。

    4.2 总结一代、二代、三代测序技术的区别

    4.2.1一代测序

    • 一代测序的最新仪器是ABI公司的3730XL。一般测序长度可达到1000bp。其主要原理是利用荧光标记的核苷酸,在PCR边合成的过程中边测序。由于四种核苷酸的荧光标记不一样,从而知道序列信息。
    • 一代测序测序精度高,准确性高,但是相对其他平台,通量很低。即相同时间内产生的数据,一代远远少于二代和三代测序。

    4.2.2二代测序

    二代测序技术,也被称为高通量测序技术。它解决了一代测序只能测一条序列的缺陷。随着科研的不断深入,我们开始分析一个物种或样本中的所有序列信息,这个时候一代测序一次测一条的方式就无法满足我们的需求。二代测序技术就是在这样的情况下诞生的。之所以称其为高通量测序就是因为它一次能够同时测很多的序列。我们通过物理或是化学的方式将DNA随机打断成无数的小片段(250-300bp),之后通过建库(这里就不深入建库的原理了)富集了这些DNA片段。接下来将建完的库放入测序仪中测序,测序仪中有着可以让DNA片段附着的区域,每一个片段都有独立的附着区域,这样测序仪可以一次检测所有附着的DNA序列信息。最后通过生物信息学分析将小片段拼接成长片段。

    二代测序特点:一次能够测大量的序列,但是片段被限制在了250-300bp,由于是通过序列的重叠区域进行拼接,所以有些序列可能被测了好多次。由于建库中利用了PCR富集序列,因此有一些量少的序列可能无法被大量扩增,造成一些信息的丢失,且PCR中有概率会引入错配碱基。所以三代测序就这样诞生了。

    4.2.3三代测序

    三代测序其实就是对二代测序的一个升级,简单来说就是它同样一次能测好多序列,但是测序的长度达到了10kb左右,并且不需要PCR富集序列,直接测序,这就解决了信息的丢失,以及碱基错配的问题。但目前来说三代测序依然有一定的缺陷:三代测序技术依赖DNA聚合酶的活性,且成本很高,目前的错误率在15%-40%,极大地高于二代测序技术的错误率不过好在三代的错误是完全随机发生的,可以靠覆盖度来纠错(但这要增加测序成本)。

    参考文献:
    1.Shendure J, Balasubramanian S, Church G M, et al. DNA sequencing at 40: past, present and future[J]. Nature, 2017.

    注:部分内容整理自网络,仅供交流学习使用,如有侵权,请联系删除

    展开全文
  • 一代、二代、三代测序技术原理与比较

    万次阅读 多人点赞 2017-11-10 14:08:02
    从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。虽然就当前形势看来第二代短读长测序技术在全球测序...

    【写在前面的话】:首先,这一篇博文中的内容并非原创,而是对多篇文献中内容的直接摘录,有些图片和资料还来自身边的同事(在此深表谢意!),再夹杂自己的零星想法,写在这里分享与大家,同时也是为了方便自己日后若有需要能够方便获得,文章比较长。

    摘要:从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。虽然就当前形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势位置,但第三和第四代测序技术也已在这一两年的时间中快速发展着。测序技术的每一次变革,也都对基因组研究,疾病医疗研究,药物研发,育种等领域产生巨大的推动作用。在这里我主要对当前的测序技术以及它们的测序原理做一个简单的小结。

    图1:测序技术的发展历程

    生命体遗传信息的快速获得对于生命科学的研究有着十分重要的意义。以上(图1)所描述的是自沃森和克里克在1953年建立DNA双螺旋结构以来,整个测序技术的发展历程。

    第一代测序技术

    第一代DNA测序技术用的是1975年由桑格(Sanger)和考尔森(Coulson)开创的链终止法或者是1976-1977年由马克西姆(Maxam)和吉尔伯特(Gilbert)发明的化学法(链降解). 并在1977年,桑格测定了第一个基因组序列,是噬菌体X174的,全长5375个碱基1。自此,人类获得了窥探生命遗传差异本质的能力,并以此为开端步入基因组学时代。研究人员在Sanger法的多年实践之中不断对其进行改进。在2001年,完成的首个人类基因组图谱就是以改进了的Sanger法为其测序基础,Sanger法核心原理是:由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应,在4个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP(分为:ddATP,ddCTP,ddGTP和ddTTP),通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的DNA序列(图2)。这个网址为sanger测序法制作了一个小短片,形象而生动。

    值得注意的是,就在测序技术起步发展的这一时期中,除了Sanger法之外还出现了一些其他的测序技术,如焦磷酸测序法、链接酶法等。其中,焦磷酸测序法是后来Roche公司454技术所使用的测序方法2–4,而连接酶测序法是后来ABI公司SOLID技术使用的测序方法2,4,但他们的共同核心手段都是利用了Sanger1中的可中断DNA合成反应的dNTP。

     

    图2:Sanger法测序原理

    第二代测序技术

    总的说来,第一代测序技术的主要特点是测序读长可达1000bp,准确性高达99.999%,但其测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。因而第一代测序技术并不是最理想的测序方法。经过不断的技术开发和改进,以Roche公司的454技术、illumina公司的Solexa,Hiseq技术和ABI公司的Solid技术为标记的第二代测序技术诞生了。第二代测序技术大大降低了测序成本的同时,还大幅提高了测序速度,并且保持了高准确性,以前完成一个人类基因组的测序需要3年时间,而使用二代测序技术则仅仅需要1周,但在序列读长方面比起第一代测序技术则要短很多。表1和图3对第一代和第二代测序技术各自的特点以及测序成本作了一个简单的比较5,以下我将对这三种主要的第二代测序技术的主要原理和特点作一个简单的介绍。 

     

    图3. 测序成本的变化

    1. Illumine

    Illumina公司的Solexa和Hiseq应该说是目前全球使用量最大的第二代测序机器,这两个系列的技术核心原理是相同的2,4。这两个系列的机器采用的都是边合成边测序的方法,它的测序过程主要分为以下4步,如图4.

         (1)DNA待测文库构建

    利用超声波把待测的DNA样本打断成小片段,目前除了组装之外和一些其他的特殊要求之外,主要是打断成200-500bp长的序列片段,并在这些小片段的两端添加上不同的接头,构建出单链DNA文库。

         (2)Flowcell

    Flowcell是用于吸附流动DNA片段的槽道,当文库建好后,这些文库中的DNA在通过flowcell的时候会随机附着在flowcell表面的channel上。每个Flowcell有8个channel,每个channel的表面都附有很多接头,这些接头能和建库过程中加在DNA片段两端的接头相互配对(这就是为什么flowcell能吸附建库后的DNA的原因),并能支持DNA在其表面进行桥式PCR的扩增。

         (3)桥式PCR扩增与变性

    桥式PCR以Flowcell表面所固定的接头为模板,进行桥形扩增,如图4.a所示。经过不断的扩增和变性循环,最终每个DNA片段都将在各自的位置上集中成束,每一个束都含有单个DNA模板的很多分拷贝,进行这一过程的目的在于实现将碱基的信号强度放大,以达到测序所需的信号要求。 

    (4)测序

    测序方法采用边合成边测序的方法。向反应体系中同时添加DNA聚合酶、接头引物和带有碱基特异荧光标记的4中dNTP(如同Sanger测序法)。这些dNTP的3’-OH被化学方法所保护,因而每次只能添加一个dNTP。在dNTP被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉。接着,再加入激发荧光所需的缓冲液,用激光激发荧光信号,并有光学设备完成荧光信号的记录,最后利用计算机分析将光学信号转化为测序碱基。这样荧光信号记录完成后,再加入化学试剂淬灭荧光信号并去除dNTP 3’-OH保护基团,以便能进行下一轮的测序反应。Illumina的这种测序技术每次只添加一个dNTP的特点能够很好的地解决同聚物长度的准确测量问题,它的主要测序错误来源是碱基的替换,目前它的测序错误率在1%-1.5%之间,测序周期以人类基因组重测序为例,30x测序深度大约为1周。

     

     

    图4. Illumina测序流程

    1. Roche 454

    Roche 454测序系统是第一个商业化运营二代测序技术的平台。它的主要测序原理是(图5 abc)2

    (1)DNA文库制备

    454测序系统的文件构建方式和illumina的不同,它是利用喷雾法将待测DNA打断成300-800bp长的小片段,并在片段两端加上不同的接头,或将待测DNA变性后用杂交引物进行PCR扩增,连接载体,构建单链DNA文库(图5a)。

    (2)Emulsion PCR (乳液PCR,其实是一个注水到油的独特过程)

    454当然DNA扩增过程也和illumina的截然不同,它将这些单链DNA结合在水油包被的直径约28um的磁珠上,并在其上面孵育、退火。

    乳液PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”(水包油),基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板和一个磁珠。

    这些被小水滴包被的磁珠表面含有与接头互补的DNA序列,因此这些单链DNA序列能够特异地结合在磁珠上。同时孵育体系中含有PCR反应试剂,所以保证了每个与磁珠结合的小片段都能独立进行PCR扩增,并且扩增产物仍可以结合到磁珠上。当反应完成后,可以破坏孵育体系并将带有DNA的磁珠富集下来。进过扩增,每个小片段都将被扩增约100万倍,从而达到下一步测序所要求的DNA量。

    (3)焦磷酸测序

    测序前需要先用一种聚合酶和单链结合蛋白处理带有DNA的磁珠,接着将磁珠放在一种PTP平板上。这种平板上特制有许多直径约为44um的小孔,每个小孔仅能容纳一个磁珠,通过这种方法来固定每个磁珠的位置,以便检测接下来的测序反应过程。

    测序方法采用焦磷酸测序法,将一种比PTP板上小孔直径更小的磁珠放入小孔中,启动测序反应。测序反应以磁珠上大量扩增出的单链DNA为模板,每次反应加入一种dNTP进行合成反应。如果dNTP能与待测序列配对,则会在合成后释放焦磷酸基团。释放的焦磷酸基团会与反应体系中的ATP硫酸化学酶反应生成ATP。生成的ATP和荧光素酶共同氧化使测序反应中的荧光素分子并发出荧光,同时由PTP板另一侧的CCD照相机记录,最后通过计算机进行光信号处理而获得最终的测序结果。由于每一种dNTP在反应中产生的荧光颜色不同,因此可以根据荧光的颜色来判断被测分子的序列。反应结束后,游离的dNTP会在双磷酸酶的作用下降解ATP,从而导致荧光淬灭,以便使测序反应进入下一个循环。由于454测序技术中,每个测序反应都在PTP板上独立的小孔中进行,因而能大大降低相互间的干扰和测序偏差。454技术最大的优势在于其能获得较长的测序读长,当前454技术的平均读长可达400bp,并且454技术和illumina的Solexa和Hiseq技术不同,它最主要的一个缺点是无法准确测量同聚物的长度,如当序列中存在类似于PolyA的情况时,测序反应会一次加入多个T,而所加入的T的个数只能通过荧光强度推测获得,这就有可能导致结果不准确。也正是由于这一原因,454技术会在测序过程中引入插入和缺失的测序错误。 

     

    图5. Roche 454测序流程

     

    1. Solid技术

    Solid测序技术是ABI公司于2007年开始投入用于商业测序应用的仪器。它基于连接酶法,即利用DNA连接酶在连接过程之中测序(图6)2,4。它的原理是:

     

    图6-a. Solid测序技术

    (1)DNA文库构建

                  片段打断并在片段两端加上测序接头,连接载体,构建单链DNA文库。

               (2)Emulsion PCR

    Solid的PCR过程也和454的方法类似,同样采用小水滴emulsion PCR,但这些微珠比起454系统来说则要小得多,只有1um。在扩增的同时对扩增产物的3’端进行修饰,这是为下一步的测序过程作的准备。3’修饰的微珠会被沉积在一块玻片上。在微珠上样的过程中,沉积小室将每张玻片分成1个、4个或8个测序区域(图6-a)。Solid系统最大的优点就是每张玻片能容纳比454更高密度的微珠,在同一系统中轻松实现更高的通量。

               (3)连接酶测序

    这一步是Solid测序的独特之处。它并没有采用以前测序时所常用的DNA聚合酶,而是采用了连接酶。Solid连接反应的底物是8碱基单链荧光探针混合物,这里将其简单表示为:3’-XXnnnzzz-5’。连接反应中,这些探针按照碱基互补规则与单链DNA模板链配对。探针的5’末端分别标记了CY5、Texas Red、CY3、6-FAM这4种颜色的荧光染料(图6-a)。这个8碱基单链荧光探针中,第1和第2位碱基(XX)上的碱基是确定的,并根据种类的不同在6-8位(zzz)上加上了不同的荧光标记。这是Solid的独特测序法,两个碱基确定一个荧光信号,相当于一次能决定两个碱基。这种测序方法也称之为两碱基测序法。当荧光探针能够与DNA模板链配对而连接上时,就会发出代表第1,2位碱基的荧光信号,图6-a和图6-b中的比色版所表示的是第1,2位碱基的不同组合与荧光颜色的关系。在记录下荧光信号后,通过化学方法在第5和第6位碱基之间进行切割,这样就能移除荧光信号,以便进行下一个位置的测序。不过值得注意的是,通过这种测序方法,每次测序的位置都相差5位。即第一次是第1、2位,第二次是第6、7位……在测到末尾后,要将新合成的链变性,洗脱。接着用引物n-1进行第二轮测序。引物n-1与引物n的区别是,二者在与接头配对的位置上相差一个碱基(图6-a. 8)。也即是,通过引物n-1在引物n的基础上将测序位置往3’端移动一个碱基位置,因而就能测定第0、1位和第5、6位……第二轮测序完成,依此类推,直至第五轮测序,最终可以完成所有位置的碱基测序,并且每个位置的碱基均被检测了两次。该技术的读长在2×50bp,后续序列拼接同样比较复杂。由于双次检测,这一技术的原始测序准确性高达99.94%,而15x覆盖率时的准确性更是达到了99.999%,应该说是目前第二代测序技术中准确性最高的了。但在荧光解码阶段,鉴于其是双碱基确定一个荧光信号,因而一旦发生错误就容易产生连锁的解码错误。

     

    图6-b. Solid测序技术

    第三代测序技术

    测序技术在近两三年中又有新的里程碑。以PacBio公司的SMRT和Oxford Nanopore Technologies纳米孔单分子测序技术,被称之为第三代测序技术。与前两代相比,他们最大的特点就是单分子测序,测序过程无需进行PCR扩增。

    其中PacBio SMRT技术其实也应用了边合成边测序的思想5,并以SMRT芯片为测序载体。基本原理是: DNA聚合酶和模板结合,4色荧光标记 4 种碱基(即是dNTP),在碱基配对阶段,不同碱基的加入,会发出不同光,根据光的波长与峰值可判断进入的碱基类型。同时这个 DNA 聚合酶是实现超长读长的关键之一,读长主要跟酶的活性保持有关,它主要受激光对其造成的损伤所影响。PacBio SMRT技术的一个关键是怎样将反应信号与周围游离碱基的强大荧光背景区别出来。他们利用的是ZMW(零模波导孔)原理:如同微波炉壁上可看到的很多密集小孔。小孔直径有考究,如果直径大于微波波长,能量就会在衍射效应的作用下穿透面板而泄露出来,从而与周围小孔相互干扰。如果孔径小于波长,能量不会辐射到周围,而是保持直线状态(光衍射的原理),从而可起保护作用。同理,在一个反应管(SMRTCell:单分子实时反应孔)中有许多这样的圆形纳米小孔, 即 ZMW(零模波导孔),外径 100多纳米,比检测激光波长小(数百纳米),激光从底部打上去后不能穿透小孔进入上方溶液区,能量被限制在一个小范围(体积20X 10-21 L)里,正好足够覆盖需要检测的部分,使得信号仅来自这个小反应区域,孔外过多游离核苷酸单体依然留在黑暗中,从而实现将背景降到最低。另外,可以通过检测相邻两个碱基之间的测序时间,来检测一些碱基修饰情况,既如果碱基存在修饰,则通过聚合酶时的速度会减慢,相邻两峰之间的距离增大,可以通过这个来之间检测甲基化等信息(图7)。SMRT技术的测序速度很快,每秒约10个dNTP。但是,同时其测序错误率比较高(这几乎是目前单分子测序技术的通病),达到15%,但好在它的出错是随机的,并不会像第二代测序技术那样存在测序错误的偏向,因而可以通过多次测序来进行有效的纠错。

     

    图7.PacBio SMRT测序原理

    Oxford Nanopore Technologies公司所开发的纳米单分子测序技术与以往的测序技术皆不同,它是基于电信号而不是光信号的测序技术5。该技术的关键之一是,他们设计了一种特殊的纳米孔,孔内共价结合有分子接头。当DNA碱基通过纳米孔时,它们使电荷发生变化,从而短暂地影响流过纳米孔的电流强度(每种碱基所影响的电流变化幅度是不同的),灵敏的电子设备检测到这些变化从而鉴定所通过的碱基(图8)。

    该公司在去年基因组生物学技术进展年会(AGBT)上推出第一款商业化的纳米孔测序仪,引起了科学界的极大关注。纳米孔测序(和其他第三代测序技术)有望解决目前测序平台的不足,纳米孔测序的主要特点是:读长很长,大约在几十kb,甚至100 kb;错误率目前介于1%至4%,且是随机错误,而不是聚集在读取的两端;数据可实时读取;通量很高(30x人类基因组有望在一天内完成);起始DNA在测序过程中不被破坏;以及样品制备简单又便宜。理论上,它也能直接测序RNA。

    纳米孔单分子测序计算还有另一大特点,它能够直接读取出甲基化的胞嘧啶,而不必像传统方法那样对基因组进行bisulfite处理。这对于在基因组水平直接研究表观遗传相关现象有极大的帮助。并且改方法的测序准确性可达99.8%,而且一旦发现测序错误也能较容易地进行纠正。但目前似乎还没有应用该技术的相关报道。

     

    图8. 纳米孔测序

     

    其他测序技术

    目前还有一种基于半导体芯片的新一代革命性测序技术——Ion Torrent6。该技术使用了一种布满小孔的高密度半导体芯片, 一个小孔就是一个测序反应池。当DNA聚合酶把核苷酸聚合到延伸中的DNA链上时,会释放出一个氢离子,反应池中的PH发生改变,位于池下的离子感受器感受到H+离子信号,H+离子信号再直接转化为数字信号,从而读出DNA序列(图9)。这一技术的发明人同时也是454测序技术的发明人之一——Jonathan Rothberg,它的文库和样本制备跟454技术很像,甚至可以说就是454的翻版,只是测序过程中不是通过检测焦磷酸荧光显色,而是通过检测H+信号的变化来获得序列碱基信息。Ion Torrent相比于其他测序技术来说,不需要昂贵的物理成像等设备,因此,成本相对来说会低,体积也会比较小,同时操作也要更为简单,速度也相当快速,除了2天文库制作时间,整个上机测序可在2-3.5小时内完成,不过整个芯片的通量并不高,目前是10G左右,但非常适合小基因组和外显子验证的测序。    

      

               

    图9. Ion Torrent

     

    小结

    以上,对各代测序技术的原理做了简要的阐述,这三代测序技术的特点比较汇总在以下表1和表2中。其中测序成本,读长和通量是评估该测序技术先进与否的三个重要指标。第一代和第二代测序技术除了通量和成本上的差异之外,其测序核心原理(除Solid是边连接边测序之外)都是基于边合成边测序的思想。第二代测序技术的优点是成本较之一代大大下降,通量大大提升,但缺点是所引入PCR过程会在一定程度上增加测序的错误率,并且具有系统偏向性,同时读长也比较短。第三代测序技术是为了解决第二代所存在的缺点而开发的,它的根本特点是单分子测序,不需要任何PCR的过程,这是为了能有效避免因PCR偏向性而导致的系统错误,同时提高读长,并要保持二代技术的高通量,低成本的优点。

    表1:测序技术的比较

    第X代

    公司

    平台名称

    测序方法

    检测方法

    大约读长(碱基数)

    优点

    相对局限性

    第一代

    ABI/生命技术公司

    3130xL-3730xL

    桑格-毛细管电泳测序法

    荧光/光学

    600-1000

    高读长,准确度一次性达标率高,能很好处理重复序列和多聚序列

    通量低;样品制备成本高,使之难以做大量的平行测序

    第一代

    贝克曼

    GeXP遗传分析系统

    桑格-毛细管电泳测序法

    荧光/光学

    600-1000

    高读长,准确度一次性达标率高,能很好处理重复序列和多聚序列;易小型化

    通量低;单个样品的制备成本相对较高

    第二代

    Roche/454

    基因组测序仪FLX系统

    焦磷酸测序法

    光学

    230-400

    在第二代中最高读长;比第一代的测序通量大

    样品制备较难;难于处理重复和同种碱基多聚区域;试剂冲洗带来错误累积;仪器昂贵

    第二代

    Illumina

    HiSeq2000,HiSeq2500/MiSeq

    可逆链终止物和合成测序法

    荧光/光学

    2x150

    很高测序通量

    仪器昂贵;用于数据删节和分析的费用很高

    第二代

    ABI/Solid

    5500xlSolid系统

    连接测序法

    荧光/光学

    25-35

    很高测序通量;在广为接受的几种第二代平台中,所要拼接出人类基因组的试剂成本最低

    测序运行时间长;读长短,造成成本高,数据分析困难和基因组拼接困难;仪器昂贵

    第二代

    赫利克斯

    Heliscope

    单分子合成测序法

    荧光/光学

    25-30

    高通量;在第二代中属于单分子性质的测序技术

    读长短,推高了测序成本,降低了基因组拼接的质量;仪器非常昂贵

    第三代

    太平洋生物科学公司

    PacBio RS

    实时单分子DNA测序

    荧光/光学

    ~1000

    高平均读长,比第一代的测序时间降低;不需要扩增;最长单个读长接近3000碱基

    并不能高效地将DNA聚合酶加到测序阵列中;准确性一次性达标的机会低(81-83%);DNA聚合酶在阵列中降解;总体上每个碱基测序成本高(仪器昂贵);

    第三代

    全基因组学公司

    GeXP遗传分析系统

    复合探针锚杂交和连接技术

    荧光/光学

    10

    在第三代中通量最高;在所有测序技术中,用于拼接一个人基因组的试剂成本最低;每个测序步骤独立,使错误的累积变得最低

    低读长; 模板制备妨碍长重复序列区域测序;样品制备费事;尚无商业化供应的仪器

    第三代

    Ion Torrent/生命技术公司

    个人基因组测序仪(PGM)

     合成测序法

    以离子敏感场效应晶体管检测pH值变化

    100-200

    对核酸碱基的掺入可直接测定;在自然条件下进行DNA合成(不需要使用修饰过的碱基)

    一步步的洗脱过程可导致错误累积;阅读高重复和同种多聚序列时有潜在困难;

    第三代

    牛津纳米孔公司

     gridION

    纳米孔外切酶测序

    电流

    尚未定量

    有潜力达到高读长;可以成本生产纳米孔;无需荧光标记或光学手段

    切断的核苷酸可能被读错方向;难于生产出带多重平行孔的装置

      

      表2:主流测序机器的成本测序比较

    以下图10展示了当前全球测序仪的分布情况。图中的几个热点区主要分布在中国的深圳(主要是华大),南欧,西欧和美国。 

    图10. 测序仪全球分布http://omicsmaps.com/#

     

    参考文献 

    1.    Sanger, F. & Nicklen, S. DNA sequencing with chain-terminating. 74, 5463–5467 (1977).

    2.    Mardis, E. R. Next-generation DNA sequencing methods. Annual review of genomics and human genetics 9, 387–402 (2008).

    3.    Shendure, J. & Ji, H. Next-generation DNA sequencing. Nature biotechnology 26, 1135–45 (2008).

    4.    Metzker, M. L. Sequencing technologies - the next generation. Nature reviews. Genetics 11, 31–46 (2010).

    5.    Niedringhaus, T. P., Milanova, D., Kerby, M. B., Snyder, M. P. & Barron, A. E. Landscape of Next-Generation Sequencing Technologies. 4327–4341 (2011).

    6.    Rothberg, J. M. et al. An integrated semiconductor device enabling non-optical genome sequencing. Nature 475, 348–52 (2011). 

     转自: http://blog.csdn.net/dyllove98/article/details/9736441

    展开全文
  • 基因测序技术发展历史及一、二、三代测序技术原理和应用 红皇后学术 公众号:红皇后学术(ID: zzlphs2516) 已关注 125 人赞同了该文章 基因测序技术 基因测序技术也称作DNA测序技术,即获得目的DNA片段碱基...

    基因测序技术发展历史及一、二、三代测序技术原理和应用

    红皇后学术

    红皇后学术

    公众号:红皇后学术(ID: zzlphs2516)

    已关注

    125 人赞同了该文章

    基因测序技术

    基因测序技术也称作DNA测序技术,即获得目的DNA片段碱基排列顺序的技术,获得目的DNA片段的序列是进一步进行分子生物学研究和基因改造的基础。

    基因测序技术的发展历史

    基因测序技术发展历史

    1977年,Walter Gilbert和Frederick Sanger发明了第一台测序仪,并应用其测定了第一个基因组序列,噬菌体X174,全长5375个碱基。

    由此开始,人类获得了探索生命遗传本质的能力,生命科学的研究进入了基因组学的时代,到至今为止的四十年时间内,测序技术已取得了相当大的发展,从第一代发展到了第三代测序技术。

    Sanger所发明的测序方法被称为第一代测序技术,该技术直到现在依然被广泛使用,但是其一次只能获得一条长度在700~1000个碱基的序列,无法满足现代科学发展对生物基因序列获取的迫切需求。

    高通量测序 (High-Throughput Sequencing, HTS) 是对传统Sanger测序的革命性变革,其解决了一代测序一次只能测定一条序列的限制,一次运行即可同时得到几十万到几百万条核酸分子的序列,因此也被称为新一代测序 (Next Generation Sequencing, NGS)或第二代测序

    第二代测序技术虽然测序的通量大大增加,但是其获得单条序列长度很短,想要得到准确的基因序列信息依赖于较高的测序覆盖度和准确的序列拼接技术,因此最终得到的结果中会存在一定的错误信息。

    因此,科研人员又发明了第三代测序技术也称为单分子测序技术,该技术在保证测序通量的基础上,对单条长序列进行从头测序,能够直接得到长度在数万个碱基的核酸序列信息。

    测序成本的变化

    除了测序通量和读长的进步之外,测序技术的大范围应用最主要应该归功于成本的下降,在早期只有第一代测序技术之时,人类基因组计划耗资30亿美元才获得了大部分的人类基因组信息,这样高昂的成本显然不是常规科学研究者能够承受的。

    基因测序技术成本变化

    新一代测序技术的发明和应用大大降低了获取核酸序列所需的成本,其打破了摩尔定律的限制,使得获得基因序列所需的金钱出现了断崖式的下降,在2008年,全基因组测序的成本降至20万美元,到2010年,该费用已经可以控制在10000美元以内,目前,测定一个人类的全基因组只需要不到1000美元即可完成

    测序技术的发展方向

    目前,基因测序技术已经在众多领域得到广泛应用,包括生物的基因组图谱绘制、环境基因组学和微生物多样性、转录水平动态响应及其调控机制,疾病相关基因的确定和诊断、表观遗传学和考古学、物种进化演替过程等等。

    就当前市场形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势地位,但第三代测序技术的应用也已在近几年实验了快速发展。

    未来基因测序技术发展方向:

    • 更快的序列获取速度;
    • 更准确的碱基识别方式;
    • 更长的单条测序序列长度;
    • 更轻便的测序仪器平台;
    • 更简便的操作过程;
    • 更便宜的测序价格。

    第一代测序技术

    1975年由Frederick Sanger所提出的链终止法以及1977年由Walter Gibert所发明的链降解法被称为第一代测序技术。

    1977年,Walter Gilbert和Frederick Sanger发明了第一台测序仪,并应用其测定了第一个基因组序列,噬菌体X174,全长5375个碱基。Walter Gilbert和Frederick Sanger也因在测序技术中的贡献获得了1980年诺贝尔化学奖。

    技术原理

    目前,基于第一代测序技术的测序仪几乎都是采用Sanger提出的链终止法。

    链终止法测序的核心原理是ddNTP的2'和3'端都不含羟基,因此在合成核酸链的过程中无法形成磷酸二酯键,从而导致DNA合成反应中断。

    在测定待测核酸片段的序列时,向反应体系中加入一定比例的带有放射性同位素标记的4种ddNTP,利用DNA聚合酶来延伸结合在待测核酸模板上的引物,直到掺入一种链终止核苷酸为止,最终会得到一组长度各相差一个碱基的链终止产物,这些产物可通过高分辨率变性凝胶电泳分离并根据其长度排序,凝胶处理后可用X-光胶片放射自显影进行检测,从而确定目的核酸片段各个位置的碱基。

    完整的测序过程分为4步:

    1. DNA碎片化:
    如要利用Sanger测序方法进行完整基因组的测定,首先要将提取得到的样品完整DNA打碎,形成DNA片段,如只是测定单个目的基因的序列,则无需进行DNA碎片化

    DNA碎片化和体外克隆

    2. PCR扩增和体外克隆:
    针对特定目的核酸片段的测序,首先要对目的测序区域进行PCR扩增;而针对碎片化DNA的测序,则要将碎片化的DNA片段通过克隆的方式连接到质粒载体中;对于部分PCR产物的测序也可以对其进行克隆,以保证测序样品的纯度和浓度

    3. ddNTP法循环测序:
    向得到的待测样品中分别加入4种dNTP和4种ddNTP,从而得到不同位置匹配终止的序列。

    ddNTP循环测序

    4. 凝胶电泳获得序列:
    对得到的序列进行凝胶电泳,根据碱基的顺序和位置确定序列信息。

    电泳确定序列

    第一代测序技术的优势和劣势

    优势:

    1. 第一代测序技术的准确性远高于二、三代测序,因此被称为测序行业的“金标准”
    2. 第一代测序每个反应可以得到700-1000bp的序列,序列长度高于二代测序
    3. 第一代测序价格低廉,设备运行时间短,适用于低通量的快速研究项目。

    劣势:

    1. 第一代测序技术一个反应只能得到一条序列,因此测序通量很低
    2. 第一代测序技术虽然单个反应价格低廉,但是获得大量序列的成本很高

    第一代测序技术的应用

    1. PCR产物测序:
      对目的基因的PCR产物进行测序,得到目的基因序列;
    2. 重测序:
      突变、SNPs、插入或缺失克隆产物的验证;
    3. 分型分析:
      微生物和真菌分类学鉴定、HLA分型、病毒分型等;
    4. 临床应用:
      肿瘤突变基因的检测和肿瘤个体化治疗,致病基因位点明确并且数量有限的单基因遗传病检测;
    5. 对新一代测序技术的结果进行验证。

    第一代测序技术常见问题及解决方法

    样品测序无信号

    此时测序完全失败,最可能的原因是待测样品出现了降解或引物失效,从而导致测序引物与待测样品无法结合。

    此时探索造成测序失败的具体原因并无实际意义,最快速、简便的办法是重新提供质量合格的引物和样品再次进行测序。

    样品测序信号差

    此种情况可能是引物或模板的质量不高或是引物和模板的匹配性不好引起的,但最有可能的原因是待测样品浓度偏低

    待测样品浓度偏低可能是由于PCR效率较低,也可能是PCR与测序间隔时间过长,导致PCR产物降解。建议PCR完成后尽快进行测序,如果PCR产物浓度本身较低,可以使用PCR产物作为模板进行二次PCR,也可以对PCR产物进行克隆后,再进行测序。

    样品测序衰减

    可能是由于待测样品包含特殊的核酸结构,如重复序列、回文结构、发卡结构、GC富集区、AT富集区等。

    由于是样品本身结构问题,因此,无法通过优化测序反应解决,应从待测样品另一端进行反向测序,之后两端的测序结果拼接得到完整序列。

    样品测序中断

    此种情况是由于待测样品包含特殊高级结构,导致碱基无法与模板结合,DNA聚合酶无法继续延伸。

    此情况与样品测序衰减解决办法相同,均为从待测样品另一端进行反向测序,经拼接后可以得到完整序列。

    样品测序移码

    测序从起始位置即发生移码是由于引物发生降解,应重新提供引物进行测序;

    如测序过程中出现局部移码的现象,则可能是待测样品包含特殊高级结构,应当反向测序后拼接得到完整序列。

    样品测序套峰

    套峰细分的话有如下几种情形:

    1. 全双峰:
      如样品为克隆后质粒,则质粒中含有多个引物结合位点;
      如样品为PCR产物,则含有非特异性扩增。
    2. 前端双峰:
      如样品为克隆后质粒,则其含有多个引物结合位点,并且其中一套模板出现测序中断的现象;
      如样品为PCR产物,则PCR产物中含有多个引物结合位点,或者PCR产物中含有引物二聚体等小片段污染。
    3. 中间双峰:
      如样品为克隆后质粒,则质粒并非单克隆;
      如样品为PCR产物,则部分产物中具有碱基缺失现象,或目的基因为等位基因导致PCR产物自身不纯。
    4. 后端双峰:
      如样品为克隆后质粒,则质粒并非单克隆;
      如样品为PCR产物,则部分产物中具有碱基缺失现象。

    解决办法:

    1. 针对二聚体及小片段干扰的情况,可以使用切胶回收的方法纯化PCR产物;
    2. 针对含有多个引物结合位点的情况,应当更换测序引物;
    3. 针对PCR产物出现碱基缺失的情况,可以使用克隆后测序以排除碱基缺失的产物;
    4. 针对非单克隆的情况,应在确认克隆无误的前提下重新挑取单克隆进行测序;
    5. 针对PCR产物含有非特异性扩增的情况,应优化PCR反应条件去除非特异性扩增,重新制备样品测序;
    6. 针对等位基因具有双模板的情况,应当采用克隆测序以保证单次测序样品序列一致。

    样品测序底峰干扰

    可能是由于测序引物不纯导致的,应当采用高纯度的引物 (PAGE级) 或重新提供引物进行测序。


    第二代测序技术

    高通量测序技术 (High-throughput sequencing, HTS) 是对传统Sanger测序技术革命性的变革,可以一次对几十万到几百万条核酸分子进行序列测定,因此也称其为下一代测序技术 (Next Generation Sequencing, NGS),高通量测序技术的出现使得对一个物种的转录组和基因组进行细致全貌的分析成为可能。

    技术平台

    经过科研人员的不断开发和改进,目前成熟的第二代测序技术共有3种,分别为Roche公司的454技术、ABI公司的SOLiD技术和Illumina公司的Solexa技术

    Roche/454

    该技术由Jonathan Rothberg于2005年发明,该技术是第一个被发明的二代测序技术,该技术引领生命科学的研究进入高通量测序时代。该技术的基本原理是:一个片段 = 一个磁珠 = 一条读长,DNA片段无需进行荧光标记,无需电泳,边合成变测序,碱基在加入到序列中时,会脱掉一个焦磷酸,通过检测焦磷酸识别碱基,因此也被称为焦磷酸测序

    ABI/SOLiD

    SOLiD技术是由连接酶测序法发展而来,Lerroy Hood在上世纪80年代中期利用连接酶法设计了第一台自动荧光测序仪。SOLiD以四色荧光标记寡核苷酸的连续连接合成为基础,取代了传统的聚合酶连接反应,可对单拷贝DNA片段进行大规模扩增和高通量并行测序

    Illumina/Solexa

    Illumina公司的第二代测序仪最早由Solexa公司研发,其同样为边合成边测序,该技术在测序的过程中,加入改造过的DNA聚合酶和带有4种荧光标记的dNTP,因为dNTP的3'羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基,此时,用激光扫描反应板表面,根据dNTP所带的荧光读取每条模板序列每一轮反应所聚合上去的核苷酸种类,经过“合成-清洗-拍照”的循环过程,最终得到目的片段的碱基排列顺序。

    技术原理

    Roche/454

    Roche/454技术原理

    1. Preparation
    454测序技术利用喷雾法将待测DNA打断成300-800bp长的小片段,并在片段两端加上不同的接头,或将待测DNA变性后用杂交引物进行PCR扩增,连接载体,构建单链DNA文库。

    2. Emulsion PCR
    在PCR反应前,将包含PCR所有反应成分的水溶液注入高速旋转的矿物油表面,形成被矿物油包裹的无数个小水滴,每一个小水滴即为一个独立的PCR反应空间,理想状态下,每一个小水滴只包含一个DNA模板和一个磁珠,磁珠表面含有与接头互补的DNA序列,经过PCR扩增后,磁珠上会富集大量序列相同的PCR产物,从而达到测序所需DNA量的要求。

    3. Sequencing
    测序时,需将磁珠固定在特制的PTP平板上。这种平板上含有许多直径约为44μm的小孔,每个小孔仅能容纳一个磁珠,通过这种方法来固定每个磁珠的位置。

    启动测序反应后,每次向PTP平板中加入一种dNTP,如果能与待测序列配对,则会在碱基连接在模板上之后释放焦磷酸,焦磷酸通过ATP硫酸化学酶激活荧光素酶产生荧光,通过PTP板另一侧的CCD照相机记录荧光,从而确定目的模板的核酸序列。

    ABI/SOLiD

    ABI/SOLiD技术原理

    SOLiD测序技术与454技术的原理比较类似,同样是采用油包水的方式进行Emulsion PCR。

    不同之处在于SOLiD形成的小水滴要比454系统小得多,只有1μm大小,并且在PCR扩增的同时对扩增产物的3'端进行修饰,为下一步的测序做准备。

    在PCR完成之后,SOLiD技术进行测序时,其反应底物不是dNTP也不是ddNTP,而含有8个碱基的单链荧光探针混合物,在测序时,这些探针按照碱基互补规则与单链DNA模板链配对,不同的探针的5'末端分别标记不同颜色的荧光染料,每两个碱基确定一个荧光信号,相当于一次能决定两个碱基,因此,这种测序方法也被称为两碱基测序法。

    Illumina/Solexa

    Illumina/Solexa技术原理

    1. Preparation
    通过不同的方法将打碎的DNA碎片末端连接序列已知的接头,构建单链DNA测序文库。

    2. Immobilization and Bridge PCR
    将测序文库的每一条单链DNA通过特异性的接头固定在一个固体支撑体上,固体支撑体的每一个单独小空间中只包含一条DNA链,之后通过PCR特异性的将模板DNA进行富集,从而达到测序所需的模板量。

    3. Sequencing
    对每一个单独的链进行碱基互补配对,反应试剂清洗和成像捕捉,不断反复进行此三步循环,每一个循环按顺序测定序列中的一个碱基。

    第二代测序技术的优缺点

    第二代测序技术的优点:

    1. 一次能够同时得到大量的序列数据,相比于一代测序技术,通量提高了成千上万倍
    2. 单条序列成本非常低廉

    第二代测序技术的缺点:

    1. 序列读长较短,Illumina平台最长为250-300bp,454平台也只有500bp左右;
    2. 由于建库中利用了PCR富集序列,因此有一些含量较少的序列可能无法被大量扩增,造成一些信息的丢失,且PCR过程中有一定概率会引入错配碱基
    3. 想要得到准确和长度较长的拼接结果,需要测序的覆盖率较高,导致结果错误较多和成本增加

    第二代测序技术的应用

    二代测序是现阶段科研市场的主力平台,主要应用包括:基因组测序、转录组测序、群体测序、扩增子测序、宏基因组测序、重测序等。

    由于成本较低,二代测序在医学领域应用也十分广泛,主要包括:癌症基因组、遗传病基因组、肿瘤与代谢疾病等。

    不同测序平台的参数比较


    第三代测序技术

    以PacBio公司的SMRT技术和Oxford Nanopore Technologies公司的纳米孔单分子技术为代表的新一代测序技术被称为第三代测序技术,与前两代测序技术相比,其最大的特点就是单分子测序,测序过程无需进行PCR扩增,并且理论上可以测定无限长度的核酸序列

    PacBio技术平台

    SMRT芯片是一种带有很多ZMW孔的厚度为100nm的金属片,将DNA聚合酶、待测序列和不同荧光标记的dNTP放入ZMW孔的底部。荧光标记的位置是磷酸基团,当一个dNTP被添加到合成链上的同时,它会进入ZMW孔的荧光信号检测区,根据荧光的种类就可以判定dNTP的种类,从而获得核酸的碱基序列信息。

    ZMW孔

    PacBio平台测序原理

    每个ZWM孔只允许一条DNA模板进入,DNA模板进入后,DNA聚合酶与模板结合,加入4种不同颜色荧光标记4种dNTP,其通过布朗运动随机进入检测区域并与聚合酶结合从而延伸模板,与模板匹配的碱基生成化学键的时间远远长于其他碱基停留的时间,因此统计荧光信号存在时间的长短,可区分匹配的碱基与游离碱基。通过统计4种荧光信号与时间的关系,即可测定DNA模板序列。

    PacBio测序原理(来自PacBio官网)

    PacBio平台技术关键

    1. DNA聚合酶,该技术得到的序列读长主要跟DNA聚合酶的活性有关,它主要受激光对其造成的损伤所影响。
    2. 荧光基团标记在核苷酸3'端磷酸上,在DNA合成过程中,3'端的磷酸键随着DNA链的延伸被断开,标记物被弃去,减少了DNA合成的空间位阻,维持DNA链连续合成,延长了测序读长。
    3. ZMW (零模波导孔),将反应信号与周围游离碱基的强大荧光背景进行区分,在一个反应管中有许多这样的圆形纳米小孔,其外径仅有100nm,激光从底部打出后不能穿透小孔进入上方溶液区,能量被限制在一个小范围里,使得荧光信号仅来自这个小反应区域,孔外其它游离核苷酸单体依然留在黑暗中,从而实现将背景荧光降到最低。

    PacBio平台技术优势

    1. 近乎完美的一致性和准确性

    三代测序单碱基错误率虽然很高,但是这种单碱基的错误是随机发生的,因此,对同一段序列测序覆盖多次就能够进行纠错,一般覆盖到10X以上的深度就能达到99.9%的正确率

    2. 不存在测序的偏好性

    因为SMRT技术在样本制备时无需PCR扩增,对于某些具有极端的碱基组成的核酸区域,三代测序也是无偏好性的,同时也不受回文序列的影响。

    3. 序列准确比对

    二代测序得到的序列由于长度不够,在进行比对时,会出现很多错误匹配,从而造成假阳性SNP位点;而PacBio测序平台得到的序列能够较均匀的覆盖参考基因组,每个序列能够明确的比对到相应的区域,在避免假阳性的同时,得到更加准确的变异位点和类型

    PacBio技术的优缺点

    PacBio技术的优点:

    1. 无需PCR扩增,不会人为的引入突变;
    2. 超长读长,平均读长可达到10Kb,最长读长可以达到40Kb;
    3. 覆盖均匀,无GC偏好性;
    4. 通过reads的自我矫正,10X以上准确率能够达到99.9%;
    5. 可以直接检测到甲基化信息,同步进行表观遗传学识别。

    PacBio技术的缺点:

    1. 单条序列错误率较高,平均核苷酸准确性不到85%;
    2. 测序成本较贵。

    PacBio技术的应用

    基因组组装

    利用PacBio测序平台,可以克服部分序列GC含量高或重复序列多等问题,更好的进行基因组详细描绘,从而进行精细的基因注释等研究。

    PacBio测序平台不需要进行PCR扩增,因此可以减少基因组组装过程中的人为错误和偏差

    PacBio测序平台读长较长,因此相比二代测序拼接结果更为准确,同时可以利用其长片段来填补二代数据组装中产生的gap和连接contig为scaffold

    全长转录组测序

    利用PacBio测序平台读长较长的特点,进行转录组测序可以直接得到转录本的全长序列,省去了二代测序的拼接过程,使得过程更为简便,结果更为准确。

    甲基化分析

    PacBio测序的技术原理可以直接检测到发生甲基化的核苷酸,因此可以在进行其它测序分析的同时完成DNA甲基化的分析

    Nanopore技术测序原理

    将在某一面上含有一对电极的特殊脂质双分子层置于一个微孔之上,该双分子层中含有很多由α溶血素蛋白组成的纳米孔,并且每个纳米孔会结合一个核酸外切酶

    当DNA模板进入孔道时,孔道中的核酸外切酶会“抓住”DNA分子,顺序剪切掉穿过纳米孔道的DNA碱基,每一个碱基通过纳米孔时都会产生一个阻断,根据阻断电流的变化就能检测出相应碱基的种类,最终得出DNA分子的序列。

    Nanopore技术原理

    Nanopore技术的优缺点

    Nanopore技术的优点:

    1. 可以检测结构变异和可变剪切;
    2. 能直接对RNA分子进行测序;
    3. 能对修饰过的碱基进行测序;
    4. 测序读长更长,可以达到150kb;
    5. 测序数据可以做到实时监控;
    6. 运行速度快。

    Nanopore技术的缺点:

    采用的是水解测序法,不能进行重复测序,因而无法达到一个满意的测序精确度。

    Nanopore技术的应用

    基因组组装

    利用其测序长的特点,可以填补基因组中大片段的gap

    临床应用

    对于临床实践,实时获取和分析DNA/RNA序列是一件很重要的事情,对于传统的高通量测序,做到这一点非常困难,但对于Nanopore技术平台,实现实时获取序列相对容易。

    Nanopore技术平台体积小、易操作,其通过电流变化检测并识别碱基,这种设计允许用户在测序过程中根据实时结果做出一些判断,对于即时诊疗有重要意义。

    基于Nanopore技术的测序平台获得序列时间相比于其它平台要短得多,因此更加适合于临床环境,使得医生能够快速获得检测结果。利用Nanopore技术平台从临床样品准备到发现致病菌只需要6小时,而完成胎儿非整倍体检查只需4小时,这些应用如果利用二代测序平台可能需要数天甚至数周时间。

    甲基化分析

    Nanopore测序技术可以检测四种胞嘧啶碱基修饰,分别为5-methycytosine、5-hydroxymethycytosine、5-formylcytosine和5-carboxylcytosine,检测准确率为92%-98%

    不同三代测序平台的比较


    图片来源:

    Shendure J, Ji, Hanlee. Next-generation DNA sequencing[J]. NATURE BIOTECHNOLOGY, 2008, 26(10):1135-1145.

    Zhang Z, Shen J, Wang H, et al. Effects of Graphene Nanopore Geometry on DNA Sequencing[J]. Journal of Physical Chemistry Letters, 2014, 5(9):1602–1607.

    写在后面:该篇文章并非完全原创,是多年前整理网络上相关文章而得,当时只是留作自学用途,但是由于时间较长,具体参考了那些文章已经忘记了,在此对这些文章的作者深表感谢!

    展开全文
  • 基因测序技术也称作DNA测序技术,即获得目的DNA片段碱基排列顺序的技术,获得目的DNA片段的序列是进一步进行分子生物学研究和基因改造的基础。 基因测序技术的发展历史 1977年,Walter Gilbert和Frederick ...

    基因测序技术

    基因测序技术也称作DNA测序技术,即获得目的DNA片段碱基排列顺序的技术,获得目的DNA片段的序列是进一步进行分子生物学研究和基因改造的基础。


    基因测序技术的发展历史

    1977年,Walter Gilbert和Frederick Sanger发明了第一台测序仪,并应用其测定了第一个基因组序列,噬菌体X174,全长5375个碱基。

    由此开始,人类获得了探索生命遗传本质的能力,生命科学的研究进入了基因组学的时代,到至今为止的四十年时间内,测序技术已取得了相当大的发展,从第一代发展到了第三代测序技术。

    Sanger所发明的测序方法被称为第一代测序技术,该技术直到现在依然被广泛使用,但是其一次只能获得一条长度在700~1000个碱基的序列,无法满足现代科学发展对生物基因序列获取的迫切需求。

    高通量测序 (High-Throughput Sequencing, HTS)是对传统Sanger测序的革命性变革,其解决了一代测序一次只能测定一条序列的限制,一次运行即可同时得到几十万到几百万条核酸分子的序列,因此也被称为新一代测序 (Next Generation Sequencing, NGS)或第二代测序

    第二代测序技术虽然测序的通量大大增加,但是其获得单条序列长度很短,想要得到准确的基因序列信息依赖于较高的测序覆盖度和准确的序列拼接技术,因此最终得到的结果中会存在一定的错误信息。

    因此,科研人员又发明了第三代测序技术也称为单分子测序技术,该技术在保证测序通量的基础上,对单条长序列进行从头测序,能够直接得到长度在数万个碱基的核酸序列信息。

    测序成本的变化

    除了测序通量和读长的进步之外,测序技术的大范围应用最主要应该归功于成本的下降,在早期只有第一代测序技术之时,人类基因组计划耗资30亿美元才获得了大部分的人类基因组信息,这样高昂的成本显然不是常规科学研究者能够承受的。

    新一代测序技术的发明和应用大大降低了获取核酸序列所需的成本,其打破了摩尔定律的限制,使得获得基因序列所需的金钱出现了断崖式的下降,在2008年,全基因组测序的成本降至20万美元,到2010年,该费用已经可以控制在10000美元以内,目前,测定一个人类的全基因组只需要不到1000美元即可完成

    测序技术的发展方向

    目前,基因测序技术已经在众多领域得到广泛应用,包括生物的基因组图谱绘制、环境基因组学和微生物多样性、转录水平动态响应及其调控机制,疾病相关基因的确定和诊断、表观遗传学和考古学、物种进化演替过程等等。

    就当前市场形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势地位,但第三代测序技术的应用也已在近几年实验了快速发展。

    未来基因测序技术发展方向:

    1. 更快的序列获取速度;

    2. 更准确的碱基识别方式;

    3. 更长的单条测序序列长度;

    4. 更轻便的测序仪器平台;

    5. 更简便的操作过程;

    6. 更便宜的测序价格。


    第一代测序技术

    1975年由Frederick Sanger所提出的链终止法以及1977年由Walter Gibert所发明的链降解法被称为第一代测序技术。

    1977年,Walter Gilbert和Frederick Sanger发明了第一台测序仪,并应用其测定了第一个基因组序列,噬菌体X174,全长5375个碱基。Walter Gilbert和Frederick Sanger也因在测序技术中的贡献获得了1980年诺贝尔化学奖。

    技术原理

    目前,基于第一代测序技术的测序仪几乎都是采用Sanger提出的链终止法。

    链终止法测序的核心原理是ddNTP的2'和3'端都不含羟基,因此在合成核酸链的过程中无法形成磷酸二酯键,从而导致DNA合成反应中断。

    在测定待测核酸片段的序列时,向反应体系中加入一定比例的带有放射性同位素标记的4种ddNTP,利用DNA聚合酶来延伸结合在待测核酸模板上的引物,直到掺入一种链终止核苷酸为止,最终会得到一组长度各相差一个碱基的链终止产物,这些产物可通过高分辨率变性凝胶电泳分离并根据其长度排序,凝胶处理后可用X-光胶片放射自显影进行检测,从而确定目的核酸片段各个位置的碱基。

    完整的测序过程分为4步:

    1. DNA碎片化:

    如要利用Sanger测序方法进行完整基因组的测定,首先要将提取得到的样品完整DNA打碎,形成DNA片段,如只是测定单个目的基因的序列,则无需进行DNA碎片化

    2. PCR扩增和体外克隆:

    针对特定目的核酸片段的测序,首先要对目的测序区域进行PCR扩增;而针对碎片化DNA的测序,则要将碎片化的DNA片段通过克隆的方式连接到质粒载体中;对于部分PCR产物的测序也可以对其进行克隆,以保证测序样品的纯度和浓度

    3. ddNTP法循环测序:

    向得到的待测样品中分别加入4种dNTP和4种ddNTP,从而得到不同位置匹配终止的序列。

    4. 凝胶电泳获得序列:

    对得到的序列进行凝胶电泳,根据碱基的顺序和位置确定序列信息。

    第一代测序技术的优势和劣势

    优势:

    1. 第一代测序技术的准确性远高于二、三代测序,因此被称为测序行业的“金标准”

    2. 第一代测序每个反应可以得到700-1000bp的序列,序列长度高于二代测序

    3. 第一代测序价格低廉,设备运行时间短,适用于低通量的快速研究项目。

    劣势:

    1. 第一代测序技术一个反应只能得到一条序列,因此测序通量很低

    2. 第一代测序技术虽然单个反应价格低廉,但是获得大量序列的成本很高

    第一代测序技术的应用

    1. PCR产物测序:对目的基因的PCR产物进行测序,得到目的基因序列;

    2. 重测序:突变、SNPs、插入或缺失克隆产物的验证;

    3. 分型分析:微生物和真菌分类学鉴定、HLA分型、病毒分型等;

    4. 临床应用:肿瘤突变基因的检测和肿瘤个体化治疗,致病基因位点明确并且数量有限的单基因遗传病检测;

    5. 对新一代测序技术的结果进行验证。

    第一代测序技术常见问题及解决方法

    样品测序无信号

    此时测序完全失败,最可能的原因是待测样品出现了降解或引物失效,从而导致测序引物与待测样品无法结合。

    此时探索造成测序失败的具体原因并无实际意义,最快速、简便的办法是重新提供质量合格的引物和样品再次进行测序。

    样品测序信号差

    此种情况可能是引物或模板的质量不高或是引物和模板的匹配性不好引起的,但最有可能的原因是待测样品浓度偏低

    待测样品浓度偏低可能是由于PCR效率较低,也可能是PCR与测序间隔时间过长,导致PCR产物降解。建议PCR完成后尽快进行测序,如果PCR产物浓度本身较低,可以使用PCR产物作为模板进行二次PCR,也可以对PCR产物进行克隆后,再进行测序。

    样品测序衰减

    可能是由于待测样品包含特殊的核酸结构,如重复序列、回文结构、发卡结构、GC富集区、AT富集区等。

    由于是样品本身结构问题,因此,无法通过优化测序反应解决,应从待测样品另一端进行反向测序,之后两端的测序结果拼接得到完整序列。

    样品测序中断

    此种情况是由于待测样品包含特殊高级结构,导致碱基无法与模板结合,DNA聚合酶无法继续延伸。

    此情况与样品测序衰减解决办法相同,均为从待测样品另一端进行反向测序,经拼接后可以得到完整序列。

    样品测序移码

    测序从起始位置即发生移码是由于引物发生降解,应重新提供引物进行测序;

    如测序过程中出现局部移码的现象,则可能是待测样品包含特殊高级结构,应当反向测序后拼接得到完整序列。

    样品测序套峰

    套峰细分的话有如下几种情形:

    全双峰:

    如样品为克隆后质粒,则质粒中含有多个引物结合位点;

    如样品为PCR产物,则含有非特异性扩增。

    前端双峰:

    如样品为克隆后质粒,则其含有多个引物结合位点,并且其中一套模板出现测序中断的现象;

    如样品为PCR产物,则PCR产物中含有多个引物结合位点,或者PCR产物中含有引物二聚体等小片段污染。

    中间双峰:

    如样品为克隆后质粒,则质粒并非单克隆;

    如样品为PCR产物,则部分产物中具有碱基缺失现象,或目的基因为等位基因导致PCR产物自身不纯。

    后端双峰:

    如样品为克隆后质粒,则质粒并非单克隆;

    如样品为PCR产物,则部分产物中具有碱基缺失现象。

    解决办法:

    针对二聚体及小片段干扰的情况,可以使用切胶回收的方法纯化PCR产物;

    针对含有多个引物结合位点的情况,应当更换测序引物;

    针对PCR产物出现碱基缺失的情况,可以使用克隆后测序以排除碱基缺失的产物;

    针对非单克隆的情况,应在确认克隆无误的前提下重新挑取单克隆进行测序;

    针对PCR产物含有非特异性扩增的情况,应优化PCR反应条件去除非特异性扩增,重新制备样品测序;

    针对等位基因具有双模板的情况,应当采用克隆测序以保证单次测序样品序列一致。

    样品测序底峰干扰

    可能是由于测序引物不纯导致的,应当采用高纯度的引物 (PAGE级) 或重新提供引物进行测序。


    第二代测序技术

    高通量测序技术 (High-throughput sequencing, HTS)是对传统Sanger测序技术革命性的变革,可以一次对几十万到几百万条核酸分子进行序列测定,因此也称其为下一代测序技术 (Next Generation Sequencing, NGS),高通量测序技术的出现使得对一个物种的转录组和基因组进行细致全貌的分析成为可能。

    技术平台

    经过科研人员的不断开发和改进,目前成熟的第二代测序技术共有3种,分别为Roche公司的454技术、ABI公司的SOLiD技术和Illumina公司的Solexa技术

    Roche/454

    该技术由Jonathan Rothberg于2005年发明,该技术是第一个被发明的二代测序技术,该技术引领生命科学的研究进入高通量测序时代。该技术的基本原理是:一个片段 = 一个磁珠 = 一条读长,DNA片段无需进行荧光标记,无需电泳,边合成变测序,碱基在加入到序列中时,会脱掉一个焦磷酸,通过检测焦磷酸识别碱基,因此也被称为焦磷酸测序

    ABI/SOLiD

    SOLiD技术是由连接酶测序法发展而来,Lerroy Hood在上世纪80年代中期利用连接酶法设计了第一台自动荧光测序仪。SOLiD以四色荧光标记寡核苷酸的连续连接合成为基础,取代了传统的聚合酶连接反应,可对单拷贝DNA片段进行大规模扩增和高通量并行测序

    Illumina/Solexa

    Illumina公司的第二代测序仪最早由Solexa公司研发,其同样为边合成边测序,该技术在测序的过程中,加入改造过的DNA聚合酶和带有4种荧光标记的dNTP,因为dNTP的3'羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基,此时,用激光扫描反应板表面,根据dNTP所带的荧光读取每条模板序列每一轮反应所聚合上去的核苷酸种类,经过“合成-清洗-拍照”的循环过程,最终得到目的片段的碱基排列顺序。

    技术原理

    Roche/454

    1. Preparation

    454测序技术利用喷雾法将待测DNA打断成300-800bp长的小片段,并在片段两端加上不同的接头,或将待测DNA变性后用杂交引物进行PCR扩增,连接载体,构建单链DNA文库。

    2. Emulsion PCR

    在PCR反应前,将包含PCR所有反应成分的水溶液注入高速旋转的矿物油表面,形成被矿物油包裹的无数个小水滴,每一个小水滴即为一个独立的PCR反应空间,理想状态下,每一个小水滴只包含一个DNA模板和一个磁珠,磁珠表面含有与接头互补的DNA序列,经过PCR扩增后,磁珠上会富集大量序列相同的PCR产物,从而达到测序所需DNA量的要求。

    3. Sequencing

    测序时,需将磁珠固定在特制的PTP平板上。这种平板上含有许多直径约为44μm的小孔,每个小孔仅能容纳一个磁珠,通过这种方法来固定每个磁珠的位置。

    启动测序反应后,每次向PTP平板中加入一种dNTP,如果能与待测序列配对,则会在碱基连接在模板上之后释放焦磷酸,焦磷酸通过ATP硫酸化学酶激活荧光素酶产生荧光,通过PTP板另一侧的CCD照相机记录荧光,从而确定目的模板的核酸序列。

    ABI/SOLiD

    SOLiD测序技术与454技术的原理比较类似,同样是采用油包水的方式进行Emulsion PCR。

    不同之处在于SOLiD形成的小水滴要比454系统小得多,只有1μm大小,并且在PCR扩增的同时对扩增产物的3'端进行修饰,为下一步的测序做准备。

    在PCR完成之后,SOLiD技术进行测序时,其反应底物不是dNTP也不是ddNTP,而含有8个碱基的单链荧光探针混合物,在测序时,这些探针按照碱基互补规则与单链DNA模板链配对,不同的探针的5'末端分别标记不同颜色的荧光染料,每两个碱基确定一个荧光信号,相当于一次能决定两个碱基,因此,这种测序方法也被称为两碱基测序法。

    Illumina/Solexa

    1. Preparation

    通过不同的方法将打碎的DNA碎片末端连接序列已知的接头,构建单链DNA测序文库。

    2. Immobilization and Bridge PCR

    将测序文库的每一条单链DNA通过特异性的接头固定在一个固体支撑体上,固体支撑体的每一个单独小空间中只包含一条DNA链,之后通过PCR特异性的将模板DNA进行富集,从而达到测序所需的模板量。

    3. Sequencing

    对每一个单独的链进行碱基互补配对,反应试剂清洗和成像捕捉,不断反复进行此三步循环,每一个循环按顺序测定序列中的一个碱基。

    第二代测序技术的优缺点

    第二代测序技术的优点:

    1. 一次能够同时得到大量的序列数据,相比于一代测序技术,通量提高了成千上万倍

    2. 单条序列成本非常低廉

    第二代测序技术的缺点:

    1. 序列读长较短,Illumina平台最长为250-300bp,454平台也只有500bp左右;

    2. 由于建库中利用了PCR富集序列,因此有一些含量较少的序列可能无法被大量扩增,造成一些信息的丢失,且PCR过程中有一定概率会引入错配碱基

    想要得到准确和长度较长的拼接结果,需要测序的覆盖率较高,导致结果错误较多和成本增加

    第二代测序技术的应用

    二代测序是现阶段科研市场的主力平台,主要应用包括:基因组测序、转录组测序、群体测序、扩增子测序、宏基因组测序、重测序等。

    由于成本较低,二代测序在医学领域应用也十分广泛,主要包括:癌症基因组、遗传病基因组、肿瘤与代谢疾病等。

    不同测序平台的参数比较


    第三代测序技术

    以PacBio公司的SMRT技术和Oxford Nanopore Technologies公司的纳米孔单分子技术为代表的新一代测序技术被称为第三代测序技术,与前两代测序技术相比,其最大的特点就是单分子测序,测序过程无需进行PCR扩增,并且理论上可以测定无限长度的核酸序列

    PacBio技术平台

    SMRT芯片是一种带有很多ZMW孔的厚度为100nm的金属片,将DNA聚合酶、待测序列和不同荧光标记的dNTP放入ZMW孔的底部。荧光标记的位置是磷酸基团,当一个dNTP被添加到合成链上的同时,它会进入ZMW孔的荧光信号检测区,根据荧光的种类就可以判定dNTP的种类,从而获得核酸的碱基序列信息。

    PacBio平台测序原理

    每个ZWM孔只允许一条DNA模板进入,DNA模板进入后,DNA聚合酶与模板结合,加入4种不同颜色荧光标记4种dNTP,其通过布朗运动随机进入检测区域并与聚合酶结合从而延伸模板,与模板匹配的碱基生成化学键的时间远远长于其他碱基停留的时间,因此统计荧光信号存在时间的长短,可区分匹配的碱基与游离碱基。通过统计4种荧光信号与时间的关系,即可测定DNA模板序列。

    PacBio平台技术关键

    DNA聚合酶,该技术得到的序列读长主要跟DNA聚合酶的活性有关,它主要受激光对其造成的损伤所影响。

    荧光基团标记在核苷酸3'端磷酸上,在DNA合成过程中,3'端的磷酸键随着DNA链的延伸被断开,标记物被弃去,减少了DNA合成的空间位阻,维持DNA链连续合成,延长了测序读长。

    ZMW (零模波导孔),将反应信号与周围游离碱基的强大荧光背景进行区分,在一个反应管中有许多这样的圆形纳米小孔,其外径仅有100nm,激光从底部打出后不能穿透小孔进入上方溶液区,能量被限制在一个小范围里,使得荧光信号仅来自这个小反应区域,孔外其它游离核苷酸单体依然留在黑暗中,从而实现将背景荧光降到最低。

    PacBio平台技术优势

    1. 近乎完美的一致性和准确性

    三代测序单碱基错误率虽然很高,但是这种单碱基的错误是随机发生的,因此,对同一段序列测序覆盖多次就能够进行纠错,一般覆盖到10X以上的深度就能达到99.9%的正确率

    2. 不存在测序的偏好性

    因为SMRT技术在样本制备时无需PCR扩增,对于某些具有极端的碱基组成的核酸区域,三代测序也是无偏好性的,同时也不受回文序列的影响。

    3. 序列准确比对

    二代测序得到的序列由于长度不够,在进行比对时,会出现很多错误匹配,从而造成假阳性SNP位点;而PacBio测序平台得到的序列能够较均匀的覆盖参考基因组,每个序列能够明确的比对到相应的区域,在避免假阳性的同时,得到更加准确的变异位点和类型

    PacBio技术的优缺点

    PacBio技术的优点:

    1. 无需PCR扩增,不会人为的引入突变;

    2. 超长读长,平均读长可达到10Kb,最长读长可以达到40Kb;

    3. 覆盖均匀,无GC偏好性;

    4. 通过reads的自我矫正,10X以上准确率能够达到99.9%;

    5. 可以直接检测到甲基化信息,同步进行表观遗传学识别。

    PacBio技术的缺点:

    1. 单条序列错误率较高,平均核苷酸准确性不到85%;

    2. 测序成本较贵。

    PacBio技术的应用

    1. 基因组组装

    利用PacBio测序平台,可以克服部分序列GC含量高或重复序列多等问题,更好的进行基因组详细描绘,从而进行精细的基因注释等研究。

    PacBio测序平台不需要进行PCR扩增,因此可以减少基因组组装过程中的人为错误和偏差

    PacBio测序平台读长较长,因此相比二代测序拼接结果更为准确,同时可以利用其长片段来填补二代数据组装中产生的gap和连接contig为scaffold

    2. 全长转录组测序

    利用PacBio测序平台读长较长的特点,进行转录组测序可以直接得到转录本的全长序列,省去了二代测序的拼接过程,使得过程更为简便,结果更为准确。

    3. 甲基化分析

    PacBio测序的技术原理可以直接检测到发生甲基化的核苷酸,因此可以在进行其它测序分析的同时完成DNA甲基化的分析

    Nanopore技术测序原理

    将在某一面上含有一对电极的特殊脂质双分子层置于一个微孔之上,该双分子层中含有很多由α溶血素蛋白组成的纳米孔,并且每个纳米孔会结合一个核酸外切酶

    当DNA模板进入孔道时,孔道中的核酸外切酶会“抓住”DNA分子,顺序剪切掉穿过纳米孔道的DNA碱基,每一个碱基通过纳米孔时都会产生一个阻断,根据阻断电流的变化就能检测出相应碱基的种类,最终得出DNA分子的序列。

    Nanopore技术的优缺点

    Nanopore技术的优点:

    1. 可以检测结构变异和可变剪切;

    2. 能直接对RNA分子进行测序;

    3. 能对修饰过的碱基进行测序;

    4. 测序读长更长,可以达到150kb;

    5. 测序数据可以做到实时监控;

    6. 运行速度快。

    Nanopore技术的缺点:

    1. 采用的是水解测序法,不能进行重复测序,因而无法达到一个满意的测序精确度。

    Nanopore技术的应用

    1. 基因组组装

    利用其测序长的特点,可以填补基因组中大片段的gap

    2. 临床应用

    对于临床实践,实时获取和分析DNA/RNA序列是一件很重要的事情,对于传统的高通量测序,做到这一点非常困难,但对于Nanopore技术平台,实现实时获取序列相对容易。

    Nanopore技术平台体积小、易操作,其通过电流变化检测并识别碱基,这种设计允许用户在测序过程中根据实时结果做出一些判断,对于即时诊疗有重要意义。

    基于Nanopore技术的测序平台获得序列时间相比于其它平台要短得多,因此更加适合于临床环境,使得医生能够快速获得检测结果。利用Nanopore技术平台从临床样品准备到发现致病菌只需要6小时,而完成胎儿非整倍体检查只需4小时,这些应用如果利用二代测序平台可能需要数天甚至数周时间。

    3. 甲基化分析

    Nanopore测序技术可以检测四种胞嘧啶碱基修饰,分别为5-methycytosine、5-hydroxymethycytosine、5-formylcytosine和5-carboxylcytosine,检测准确率为92%-98%

    不同三代测序平台的比较


    图片来源:

    Shendure J, Ji, Hanlee. Next-generation DNA sequencing[J]. NATURE BIOTECHNOLOGY, 2008, 26(10):1135-1145.

    Zhang Z, Shen J, Wang H, et al. Effects of Graphene Nanopore Geometry on DNA Sequencing[J]. Journal of Physical Chemistry Letters, 2014, 5(9):1602–1607.



    作者:红皇后学术
    链接:https://www.jianshu.com/p/ee9e5de8664f
    来源:简书
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    展开全文
  • 摘 要:本文介绍了第三代DNA测序技术原理及应用现状,并对相关的生物信息学技术进行了综述。第三代测序技术以单分子测序为主要特点,目前已广泛应用于食品科学及生命科学研究的各个领域,其代表有Heliscope Bio ...
  • 三代基因组测序技术原理简介

    千次阅读 2013-08-02 22:59:02
     摘要:从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。虽然就当前形势看来第二代短读长测序
  • 三代基因组测序技术简介及其原理整理第一代测序技术第一代DNA测序技术用的是1975年由桑格(Sanger)和考尔森(Coulson)开创的链终止法以及1976-1977年由马克西姆(Maxam)和吉尔
  • 针对PacBio单分子测序——第三代测序技术的测序原理和读长 DNA基因测序技术从上世纪70年代起,历经三代技术后,目前已发展成为一项相对成熟的生物产业。测序技术的应用也扩展到了...
  • DNA测序本质上就是识别ATCG四种碱基,但是一方面四种碱基实在太小了,属于纳米级别,另一方面嘌呤和嘌呤,嘧啶和嘧啶之间化学结构非常相似,不容易区分。从53年提出DNA双螺旋结构之后,生物学家一直努力通过各种...
  • sanger测序sanger是第一代测序,它是使用的链...将结合了引物的序列等量放入4个反应体系中,然后将dna聚合酶和dNTPs加入各个反应体系中; 下一步,也是最关键的一步,在四个不同的反应体系中分别加入A,T,C,G四种带...
  • DNA测序技术主要有两种方法;1. Sanger双脱氧链终止;基本原理 聚丙烯酰胺凝胶电泳;无标题;2具体操作 ;同理第二个反应产生的都是以C结;假如有一个DNA, 互补序列是;制得的四组混合物全部平行地点加;制备单链模板 ;4 高...
  • 第三代测序技术的方法原理及其在生物领域的应用 张子敬刘燕蓉张顺进贺花李佳霄刘贤吕世杰李志明王二耀雷初朝黄永震 【摘要】:在自然界中,生物DNA的碱基序列包含着生物体中绝大多数的遗传信息,破译这些碱基序列就...
  • 第三代基因测序技术又被为“Single Molecule Real Time (SMRT™) DNA Sequencing”(单分子实时DNA测序技术),该方法基于纳米孔的单分子读取技术,不需要扩增即可快速读取序列。目前,Pacific Biosciences公司已经...
  • 三代测序技术简介

    2020-09-21 13:13:21
    目前,三代测序技术原理分为单分子荧光测序和纳米孔测序两大阵营,其代表公司分别为Pacific Bioscience和Oxford Nanopore Technologies。现在市场接受度和使用度最高的是Pacific Bioscience三代测序仪,其SMRT技
  • 测序,简单的来说就是把DNA化学信号转变成计算机可识别的数字信号,具体的来说就是把核酸的碱基序列的信息转化为数字型号,从最初的测序技术,发展到如今,已经是第三代测试技术了,先整理如下。 第一代 NGS测序技术...
  • 一代测序原理 (Sanger法测序)

    千次阅读 2020-03-08 17:50:32
    上世纪70年代末,他提出快速测定脱氧核糖核酸(DNA)序列的技术“双脱氧终止法”,也被称作“Sanger法”。 早在2001年完成的人类基因组框图,采用的就是该方法。而且因准确率高,直到今天还在广泛使用,也被称为...
  • 自1977年第一代测序技术问世以来,经过四十余年的探索,DNA测序技术取得了重大进展。随着对测序成本降低的需求,以高通量为特点的第二代测序技术(NGS)应运而生并逐步成熟,以单分子测序为特点的第三代测序技术也...
  • 原理:体外表达的蛋白和DNA进行亲和纯化,将与蛋白结合的DNA洗脱后进行高通量测序技术流程:将编码转录因子的CDS序列构建到含有亲和标签的载体中,构建蛋白表达载体,进行体外蛋白表达,形成转录因子和亲和标
  • 第三代测序技术是一种集高通量、快速度、长读长及低成本等多种优点于一身的新型测序技术,它的出现为基因组学、转录组学及DNA甲基化等研究 注入了新活力。本文在介绍基本技术原理的基础上,着重概述了第三代测序技术...
  • 临床微生物高通量检测,应用场景不同,各种测序技术令人眼花缭乱,但我们可以做如下总结。检测对象:病原体核酸,或人宿主自身核酸测序技术DNA 测序,或 RNA 测序测序范围:DNA 靶向,...
  • 这种DNA末端终止法测序技术原理:主要通过在DNA聚合酶、模板以及放射性同位素标记物的引物、dNTP以及ddNTP的作用后发生延伸反应,基于 ddNTP的存在,接着形成长度不一 的DNA延伸片段;然后利用平板凝胶电泳,用4条电...
  • 7种测序平台

    千次阅读 2019-10-04 07:25:07
    1. illumina测序化学原理 2. HiSeq 测序仪工作原理 ...6. illumina 公司的Nano Well 测序技术 7.第一代DNA测序 1. illumina测序化学原理 今天的第一期节目,主要给大家介绍Illumina公司的技术。Illumina公司...
  • 历史:第一代DNA测序技术(又称Sanger测序)在1975年,由Sanger等人开创,并在1977年完成第一个基因组序列(噬菌体X174),全长5375个碱基。研究人员经过30年的实践并对技术及测序策略的不断改进(如使用了不同策略...
  • 用于在全基因组范围中研究DNA结合蛋白(相互反应)、组蛋白修饰(表观遗传标记)和核小体的技术,研究这三个主题可有助于了解基因之间的相互调控以及染色体的功能结构。 在生理状态下,把细胞内的DNA与蛋白质交联...
  • 单分子实时测序

    2019-12-12 18:56:30
    以前,我曾写过关于纳米孔测序的令人兴奋的可能性的信息-一种新的测序技术,该技术基于单链DNA穿过纳米孔时产生的“签名”电流。纳米孔测序技术的优势在于您可以获得实时测序结果。 今天,我要谈谈另一个不同的NGS...
  • 另外,通俗的说,高通量测序技术其实就是一次可以测很多不一样DNA序列的技术。当PCR技术和高通量测序技术结合起来,就可以解决很多实际研究中的问题。当然,也不是完全没有限制,主要限制因素是读长和碱基平衡问题。...

空空如也

空空如也

1 2 3
收藏数 43
精华内容 17
关键字:

dna测序技术原理