精华内容
下载资源
问答
  • 测序仪的序列DNA测序的历史 作者链接打开覆盖面板詹姆斯·希瑟·本杰明·链 展示更多 添加到Mendeley 分享 引用 https://doi.org/10.1016/j.ygeno.2015.11.003获取权利和内容 根据Elsevier...

    测序仪的序列:DNA测序的历史

    根据Elsevier用户许可
    打开档案
     

    强调

     

    我们回顾了过去50年来DNA测序技术的急剧变化。

    第一代方法使克隆DNA群体的测序成为可能。

    第二代通过并行处理许多反应,大大提高了通量。

    第三代方法允许对单个DNA分子进行直接测序。

     

    抽象

    确定生物样品中核酸残基的顺序是各种研究应用程序不可或缺的组成部分。在过去的五十年中,大量研究人员将自己投入到技术和技术的生产中来促进这一壮举,对DNA和RNA分子进行测序。这个时间尺度已经发生了巨大的变化,从短的寡核苷酸测序到数百万个碱基,从努力向单个基因的编码序列推论到快速,广泛可用的全基因组测序。本文回顾了那些年,遍历了不同一代的测序技术,重点介绍了其中的一些关键发现,研究人员和序列。

    关键词

    脱氧核糖核酸
    核糖核酸
    排序
    音序器
    历史

    1 。介绍

     

    “ ... [ A ]对序列的了解可能有助于我们对生物的理解。

    弗雷德里克·桑格[1]

     

    的顺序的核酸的多核苷酸链最终包含陆地生活的遗传和生物化学性质的信息。因此,测量或推断此类序列的能力是生物学研究所必需的。这篇综述探讨了多年来研究人员如何解决DNA测序方法的问题,以及定义这种方法的每一代的特征。

    2 。第一代DNA测序

    沃森和克里克著名解决DNA的三维结构在1953年,由罗莎琳德富兰克林和威尔金斯产生晶体学数据的工作[2] [3] ,这有助于两个概念框架DNA复制和编码的蛋白质在核酸。但是,“读取”或测序DNA的能力已有一段时间没有出现。推测蛋白质链序列的策略似乎并不容易应用于核酸研究:DNA分子更长,并且由更少的彼此相似的单元组成,因此很难区分它们[4]。需要制定新的策略。

    最初的工作集中在对相对较纯的RNA种类(例如微生物核糖体或转移RNA或单链RNA噬菌体的基因组)最容易获得的种群进行测序。这些不仅容易在培养物中大量生产,而且它们也不会因互补链而复杂化,并且通常比真核DNA分子短得多。此外,已经知道并可获得能够在特定位点切割RNA链的RNase酶。尽管有这些优点,但由于研究人员可用的技术(从分析化学中借用的)只能测量核苷酸组成,而不能进行排序,因此进展仍然缓慢[5]。然而,通过将这些技术与选择性核糖核酸酶处理相结合以产生完全和部分降解的RNA片段[6](并结合观察到RNA包含不同的核苷酸碱基[7] ),1965年Robert Holley及其同事得以生产出第一个整个序列,来自 酿酒酵母 的丙氨酸tRNA的序列[8] 。同时,Fred Sanger及其同事开发了一种相关技术,该技术基于二维分级分离 后放射性标记的部分消化碎片的检测[9]。,这使研究人员能够稳定地添加到不断增长的核糖体库中并转移RNA序列[10][11][12][13][14] 。这也是通过使用该2-d分馏方法,其瓦尔特·菲耶实验室能够产生第一个完整的蛋白质编码基因序列在1972年,该的外壳蛋白噬菌体MS2 [15] ,随后四年后通过其完整的基因组[16]

    大约在这个时候,各种研究人员开始采用他们的方法来对DNA进行测序,并借助最近用DNA基因组纯化噬菌体的方法,为测试新方案提供了理想的资源。利用肠道细菌噬菌体λ具有5'突出的'粘性'末端的观察结果,Ray Wu和Dale Kaiser使用DNA聚合酶用放射性核苷酸填充末端,一次提供每个核苷酸,并测量掺入以推断序列[17]。 ][18] 。不久之后,通过使用特定的寡核苷酸将这一原理推广引发DNA聚合酶。然后可以使用放射性核苷酸的掺入来推断任何地方的核苷酸顺序,而不仅是在噬菌体基因组的末端[19][20][21]。然而,碱基的实际测定仍然限于短的DNA片段,并且通常仍然涉及大量的分析化学和分级分离程序。

    下一个产生重大影响的实际变化是通过聚丙烯酰胺凝胶电泳通过多核苷酸长度的单次分离来代替2-D分级分离(通常包括电泳和色谱分离)。从1970年代中期开始,该技术被用于两个有影响力但复杂的协议中:1975年的Alan Coulson和Sanger的“正负”系统以及Allan Maxam和Walter Gilbert的化学裂解技术[22][23] 。正负技术使用DNA聚合酶从引物合成并掺入放射性标记的核苷酸,然后再进行两次第二次聚合反应:“加”反应,其中仅存在一种类型的核苷酸,因此所有延伸都将以该碱基结尾;“减”反应,其中使用三个碱基,其产生直至下一个缺失的核苷酸。通过在聚丙烯酰胺凝胶上电泳产物并在八个泳道之间进行比较,一个人就可以推断出所覆盖序列中每个位置的核苷酸位置(除了那些均聚物中的核苷酸,即相同核苷酸的泳道)。Sanger及其同事正是使用这种技术对第一个DNA基因组进行了测序,即噬菌体ϕ X174(或称为“ PhiX”),在当今的许多测序实验室中都具有阳性对照基因组的地位)[24]。。虽然仍然使用聚丙烯酰胺凝胶来解析DNA片段,但Maxam和Gilbert技术在方法上有很大不同。放射性标记的DNA不再依赖于DNA聚合酶来产生片段,而是使用能在特定碱基处断裂链的化学物质进行处理。在聚丙烯酰胺凝胶上电泳后,可以确定裂解片段的长度(从而确定特定核苷酸的位置),从而推断出序列(参见图1 ,右)。这是第一种被广泛采用的技术,因此可以认为是“第一代” DNA测序的真正诞生。

    1. 下载:下载高分辨率图像(529KB)
    2. 下载:下载全图

    图1。第一代DNA测序技术。说明了要进行测序的示例DNA a)经过Sanger(b)或Maxam–Gilbert(c)测序。(b):Sanger的“链终止”排序。DNA聚合中包括给定类型的放射性或荧光标记的ddNTP核苷酸-一旦掺入,将阻止进一步延伸-低浓度的反应(从5'序列引发,未显示)。因此,在这四个反应的每一个中,随着ddNTP在该碱基的特定实例(下划线的3'末端字符)处随机掺入,会生成带有3'截短的序列片段。(c):Maxam和Gilbert的“化学测序”方法。首先必须标记DNA,通常是 在其5'磷酸部分(此处用show表示)中包含放射性P 32 。然后使用不同的化学处理方法从一小部分DNA位点选择性去除碱基。从嘧啶(胞嘧啶和胸腺嘧啶)中除去碱,而肼在高盐浓度下只能从胞嘧啶中除去碱。然后可以使用酸从嘌呤(腺嘌呤和鸟嘌呤)中除去碱基,并使用硫酸二甲酯攻击鸟嘌呤(尽管腺嘌呤的影响程度也要小得多)。然后将哌啶用于在脱碱基位点切割磷酸二酯主链,产生可变长度的片段。(d):然后可以通过电泳观察从任何一种方法产生的碎片在高分辨率聚丙烯酰胺凝胶上:通过读取“向上”凝胶来推断序列,因为较短的DNA片段迁移最快。在Sanger测序(左)中,通过找到给定位点存在该条带的泳道来推断序列,因为3'端标记的ddNTP对应于该位置的碱基。Maxam–Gilbert测序需要额外的逻辑步骤:Ts和As可以分别从嘧啶或嘌呤泳道中的一条带直接推断,而G和C由G和A  + G泳道中的双条带表示,或C和C + T车道。

    然而,随着Sanger的“链终止”或双脱氧技术的发展[25],永远改变了DNA测序技术进步的重大突破出现在1977年。链终止技术利用了脱氧核糖核苷酸(dNTP)的化学类似物,它们是DNA链的单体。双脱氧核苷酸(ddNTPs)缺少DNA链延伸所需的3'羟基,因此无法与下一个dNTP的5'磷酸形成键[26]。。将放射性标记的ddNTPs以标准dNTPs浓度的一部分混合到DNA延伸反应中,会产生每种可能长度的DNA链,因为双脱氧核苷酸随着链的延伸而随机掺入,从而阻止了进一步的发展。通过执行包含每个ddNTP碱基的四个平行反应并在聚丙烯酰胺凝胶的四个泳道上运行结果,一个人可以使用放射自显影来推断原始模板中的核苷酸序列是什么,因为相应泳道中会存在一个放射性带在凝胶的那个位置(见图1), 剩下)。在遵循与其他技术相同的原理(产生所有可能的增量长度序列并标记最终核苷酸的原理)的同时,准确性,鲁棒性和易用性导致双脱氧链终止法(或简称为Sanger测序)的发展未来几年用于DNA测序的最常见技术。

    在接下来的几年中,对Sanger测序进行了许多改进,主要涉及用基于荧光的检测方法(使反应在一个容器中而不是在四个容器中发生)替换磷或三放射性放射振荡,并通过基于毛细管的电泳改进检测。这些改进都促进了日益自动化的DNA测序仪的开发[27][28][29][30][31][32][33],随后是第一批商业化DNA测序机[34],用于对日益复杂的物种的基因组进行测序。

    这些第一代DNA测序仪产生的读取长度略小于1 kb(kb):为了分析更长的片段,研究人员使用了诸如“ shot弹枪测序”之类的技术,其中重叠的DNA片段被克隆并分别测序,然后组装进入计算机中的一个长连续序列(或“连续”)[35][36]。聚合酶链反应(PCR)[37][38]重组DNA技术 [39][40]等技术的发展通过提供产生测序所需的高浓度纯DNA种类的方法,进一步帮助了基因组学革命。通过减少直接路线也可以改善排序。例如,Klenow片段DNA聚合酶(一种缺乏5'到3'核酸外切酶活性的大肠杆菌DNA聚合酶的片段,是通过天然酶的蛋白酶消化而产生的[41]),由于其具有有效地整合ddNTP。但是,更多的测序基因组和遗传操作工具为寻找聚合酶提供了资源。更好地适应了用于测序的不断变化的dNTP的其他化学部分[42]。最终,较新的双脱氧测序仪,例如由Applied Biosystems生产的Leroy Hood的研究开发的ABI PRISM系列[43],它可以同时对数百个样品进行测序[44] –被用于人类基因组计划,有助于提前产生的该庞大的事业年第一草案[45] [46] 

    3 。第二代DNA测序

    随着大规模双脱氧测序工作的发展,出现了另一种技术,该技术为下一代DNA测序仪的第一波发展奠定了基础。该方法与现有方法显着不同,因为它在电泳可视化之前没有通过使用放射性或荧光标记的dNTPs或寡核苷酸来推断核苷酸同一性。取而代之的是,研究人员采用了最近发现的一种发光方法来测量焦磷酸盐的合成:这是一种由两种酶组成的过程,其中使用ATP硫酸化酶将焦磷酸盐转化为ATP,然后将其用作荧光素酶的底物。,因此产生的光与焦磷酸盐的量成比例[47]。该方法用于通过测量焦磷酸盐的产生来推断序列,因为每个核苷酸依次通过系统洗涤,然后通过固定在固相上的模板DNA进行[48] 。请注意,尽管存在差异,但桑格的双脱氧法和焦磷酸测序法都是“合成序列”(SBS)技术,因为它们都需要DNA聚合酶的直接作用才能产生可​​观察到的输出(与Maxam–Gilbert技术相反) )。由PålNyrén及其同事首创的焦磷酸测序技术具有许多被认为是有益的功能:可以使用天然核苷酸进行测序(而不是在链终止方案中使用经过严重修饰的dNTP),并且可以实时观察(而不是需要冗长的电泳) [49][50][51]。后来的改进包括将DNA附着在顺磁珠上,并酶降解未结合的dNTP,从而消除了冗长的洗涤步骤。该技术带来的主要困难是找出在给定位置连续存在多少个相同的核苷酸:释放的光的强度与均聚物的长度相对应,但是噪音在4或3以上时产生非线性读数。五个相同的核苷酸[51]。焦磷酸测序后来获得了由乔纳森·罗斯堡(Jonathan Rothburg)创立的生物技术公司454 Life Sciences的许可,在这里它发展成为第一个成功的重要商业“下一代测序”(NGS)技术。

    454生产的测序仪(后来由罗氏公司购买)是一种范式转变,因为它们可以使测序反应大规模平行化,从而大大增加了可在任何一次运行中测序的DNA量[52] 。DNA分子文库首先通过衔接子序列与珠子连接,然后经历油乳液PCR(emPCR)[53]覆盖克隆DNA群体中的每个珠子,理想情况下,平均一个DNA分子最终在一个珠子,在乳液中以其自身的小滴放大(请参见图2)a和c)。然后将这些涂有DNA的珠子在每孔可容纳一个珠子的微微升反应板上洗涤;然后,随着较小的与珠子连接的酶和dNTP在板上的洗涤,发生焦磷酸测序,并使用孔下面的电荷耦合器件(CCD)传感器测量焦磷酸盐的释放。这种装置能够产生大约400-500个碱基对(bp)的读长,大约可以容纳一百万个孔,其中包含适当的克隆包被的珠子[52] 。这种并行化使测序工作的产量提高了几个数量级,例如,使研究人员可以对单个人类基因组(属于DNA结构先驱James Watson)进行完全测序,比通过DNA测序进行的类似工作更快,更便宜。企业家克雷格·文特(Craig Venter)的团队在前一年使用Sanger测序[54] [55] 。消费者广泛使用的第一台高通量测序(HTS)机器是最初的454机器,称为GS 20,后来被454 GS FLX取代,后者提供了更多的读取次数(通过在“皮蒂板(Pilotier'Plate)以及更好的质量数据[56]。这种在微米级上进行大量平行测序反应的原理(通常是由于微细加工和高分辨率成像的改进而得以实现的)是第二代DNA测序的定义[57]

    随着454的成功,出现了许多并行测序技术。其中最重要的是Solexa测序方法,后来被Illumina收购[56] 。代替通过执行基于珠子的emPCR进行平行化,将带有括号的DNA分子通过与流通池结合的互补寡核苷酸的草坪上进行。随后的固相PCR从每条原始原始流通池结合DNA链中的 每条产生邻近的克隆群体簇[58][59] 。该过程被称为“桥扩增”,因为复制的DNA链必须拱起以引发相邻表面结合的寡核苷酸引发下一轮聚合反应(请参见2b和d)[56]。测序本身是通过使用荧光“可逆终止子” dNTP以SBS方式实现的,由于荧光团占据3'羟基位置,因此无法立即结合其他核苷酸。必须先将其裂解,然后才能继续聚合,这样才能使测序以同步方式进行[60] 。这些修饰的dNTP和DNA聚合酶循环地在灌注的,单链的流通池结合簇上洗涤。在每个循环中,在酶促去除封闭的荧光部分并继续至下一个位置之前,可以通过用适当的激光激发荧光团,用CCD来监测掺入核苷酸的身份。虽然第一台Genome Analyzer(GA)机器最初只能产生非常短的读数(最长35 bp长),但它们的优势在于可以产生配对末端(PE)数据,在该数据中两端的序列记录每个DNA簇。这是通过首先从单链流动细胞结合的DNA中获得一个SBS读取,然后从剩余的流动细胞结合的寡核苷酸进行单轮固相DNA延伸并去除已经测序的链来实现的。这样就改变了DNA链相对于流通池的方向,然后从分子的第一个相对端获得了第二个读数。由于输入分子的长度大约为已知长度,因此拥有PE数据可提供更多信息。当将读段映射到参考序列时,尤其是在重复序列中,这可以提高准确性,并有助于检测剪接的外显子和重排的DNA或融合基因。之后是标准的Genome Analyzer版本(GAIIx),随后是HiSeq,这是一台具有更大读取长度和深度的机器,然后是MiSeq,它是一种吞吐量较低(但成本较低)的机器,具有更快的周转时间和更长的读取长度。然后从与第一分子相反的一端获得第二读。由于输入分子的长度大约为已知长度,因此拥有PE数据可提供更多信息。当将读段映射到参考序列时,尤其是在重复序列中,这将提高准确性,并有助于检测剪接的外显子和重排的DNA或融合基因。之后是标准的Genome Analyzer版本(GAIIx),随后是HiSeq,这是一台具有更大读取长度和深度的机器,然后是MiSeq,它是一种吞吐量较低(但成本较低)的机器,具有更快的周转时间和更长的读取长度。然后从与第一分子相反的一端获得第二读。由于输入分子的长度大约为已知长度,因此拥有PE数据可提供更多信息。当将读段映射到参考序列时,尤其是在重复序列中,这将提高准确性,并有助于检测剪接的外显子和重排的DNA或融合基因。之后是标准的Genome Analyzer版本(GAIIx),随后是HiSeq,这是一台具有更大读取长度和深度的机器,然后是MiSeq,它是一种吞吐量较低(但成本较低)的机器,具有更快的周转时间和更长的读取长度。特别是在重复序列中,有助于检测剪接的外显子和重排的DNA或融合基因。之后是标准的Genome Analyzer版本(GAIIx),随后是HiSeq,这是一台具有更大读取长度和深度的机器,然后是MiSeq,它是一种吞吐量较低(但成本较低)的机器,具有更快的周转时间和更长的读取长度。特别是在重复序列中,有助于检测剪接的外显子和重排的DNA或融合基因。之后是标准的Genome Analyzer版本(GAIIx),随后是HiSeq,这是一台具有更大读取长度和深度的机器,然后是MiSeq,它是一种吞吐量较低(但成本较低)的机器,具有更快的周转时间和更长的读取长度。[61][62]

    1. 下载:下载高分辨率图像(780KB)
    2. 下载:下载全图

    图2。第二代DNA测序平行扩增。(a):DNA分子在乳液PCR(emPCR)中克隆扩增。衔接子连接和PCR产生DNA文库具有合适的5'和3'末端的片段,然后可以将其制成单链并固定在单独的带有寡核苷酸标签的微珠上。然后可以使用水性扩增试剂在油中乳化Bead-DNA偶联物,理想地产生仅包含一个Bead的乳液液滴(在最左边的两个液滴中显示,不同的分子用不同的颜色表示)。然后在emPCR期间进行克隆扩增,因为每个模板DNA在物理上都与所有其他模板DNA分开,而子代分子仍与微珠结合。这是454,Ion Torrent和polony测序协议中测序的概念基础。(b):桥接扩增,以在平面固相PCR反应中产生克隆DNA群体簇,如Solexa / Illumina测序中所发生的。当在流动池上洗涤时,具有与两个草坪寡核苷酸互补的终止序列的单链DNA将退火,并且在等温PCR期间,PCR将在狭窄的区域中复制,在相邻位点弯曲成引物,从而产生相同分子的局部簇。(c)和(d)展示了如何以高度平行的方式读取这两种不同形式的克隆扩增序列:可以在微微孔板上洗涤emPCR产生的微珠,微微孔板的孔足够大,只能容纳一个珠子( C)。然后可以将DNA聚合酶添加到孔中,然后依次洗涤每个核苷酸,并监测dNTP的掺入(例如,通过焦磷酸盐)或氢离子释放)。通过桥接扩增(d)产生的与流动细胞结合的簇可以通过在正在进行的延伸反应的末端检测荧光可逆终止子核苷酸来可视化,这需要逐周期测量并去除终止子。

    许多其他测序公司,每个都拥有自己的新方法,也已经出现(或消失了),并且对可行的实验和整个市场产生了不同的影响。在第二代测序的早期,也许第三个主要选择(以及454和Solexa / Illumina测序)[63]是来自Applied Biosystems的寡核苷酸连接和检测(SOLiD)系统进行测序(该公司与Life Technologies合并后成为Life Technologies)。 Invitrogen)[64] 。顾名思义,SOLiD测序不是通过合成(即用聚合酶催化)进行的,而是通过使用DNA连接酶进行连接进行的,其建立在先前乔治·丘奇小组开发的开源“ polony”测序基础上[65]。尽管SOLiD平台无法产生Illumina机器的读取长度和深度[66],使组装更具挑战性,但它仍保持了每单位成本的竞争力[67]。另一种基于序列连接的著名技术是Complete Genomic的“ DNA纳米球”技术,该技术类似地通过探针连接获得序列,但克隆DNA群体的产生是新颖的:使用滚环扩增代替珠或桥扩增产生长的DNA链,该DNA链由模板序列的重复单元组成,并带有衔接子,然后再自组装成纳米球,将其固定在待测序的载玻片上[68]。最后一个显着的第二代测序平台是由Jonathan Rothburg留下454离子激流(另一Life Technologies公司的产品)是第一个所谓的“后光测序”技术后开发的,因为它既不使用也不荧光发光 [69]。以类似于454测序的方式,在微微孔板上洗涤带有DNA片段的克隆种群(通过emPCR产生)的珠子,依次洗涤每个核苷酸;但是,核苷酸掺入不是通过焦磷酸盐的释放来测量的,而是通过聚合过程中质子(H +离子)的释放所引起的pH差异来测量的,这可以使用制造微处理器芯片中使用的互补金属氧化物半导体(CMOS)技术来实现[69] 。该技术允许在实际检测阶段进行非常快速的测序[67],尽管与454(及所有其他焦磷酸测序技术)一样,由于多个匹配的dNTP并入了信号,它由于信号丢失而无法轻易解释均聚物序列[70]。

    在核苷酸测序技术的这些显着变化的推动下,经常描述的“基因组学革命”极大地改变了与DNA测序相关的成本和简便性。DNA测序仪的功能以比摩尔定律所描述的计算机革命更快的速度增长:微芯片的复杂性(以每单位成本的晶体管数量来衡量)大约每两年翻一番,而2004年至2004年之间的测序能力却翻了一番。 2010年每五个月翻一番[71] 。各种分支技术的化学性质,功能和规格各不相同,从而为研究人员提供了用于设计实验的多样化工具箱。但是,近年来,Illumina测序平台已经取得了最大的成功,接近垄断[72],因此可以认为对第二代DNA测序仪的贡献最大。

    4 。第三代DNA测序

    关于什么定义了DNA测序技术的不同世代,有很多讨论,特别是关于从第二到第三的划分[73][74][75][76] 。有人认为,单分子测序(SMS),实时测序和与先前技术的简单区别应该是第三代的主要特征。特定技术可能跨越边界也是可行的。在这里,我们认为第三代技术是能够对单个分子进行测序的技术,从而消除了所有先前技术共享的DNA扩增要求。

    第一SMS技术是在斯蒂芬·奎克的实验室开发的[77] [78] ,后来由Helicos的生物科技公司商业化,并以相同的方式Illumina公司做广泛的工作,但没有任何桥梁放大; DNA模板附着在平面上,然后将适当的荧光可逆终止子dNTP(所谓的“虚拟终止子” [79])在一个碱基上洗一次并成像,然后切割并循环下一个碱基。虽然相对较慢且昂贵(并且产生相对短的读取),但这是第一项允许对非扩增DNA进行测序的技术,从而避免了所有相关的偏倚和错误[73][75]。当Helicos在2012年初申请破产时[80]其他公司也使用了第三代指挥棒。

    在撰写本文时,使用最广泛的第三代技术可能是Pacific Biosciences [81]提供的单分子实时(SMRT)平台,可在PacBio系列机器上使用。在SMRT运行期间,DNA聚合发生在称为零模式波导(ZMW)的微细加工的纳米结构的阵列中,该结构基本上是覆盖芯片的金属膜中的小孔。这些ZMW利用通过直径小于其波长的孔径的光的特性,使其孔径呈指数衰减,专门照亮井底。由于激光激发的区域非常小,即使在溶液中相邻分子的背景下,这也可以显示靠近ZMW底部的单个荧光团分子[82] 。单个DNA的沉积聚合酶的ZMW的内部分子它们置于照明区域(内侧图3一个在通过洗涤:)DNA文库感兴趣的荧光dNTP和单核苷酸的DNA链的延伸可以实时监测,因为掺入的荧光核苷酸(只有那些核苷酸)将提供可检测的荧光,之后染料被切割掉,从而终止了该信号位置[83]。这个过程可以在很短的时间内对单个分子进行测序。PacBio系列具有许多其他优势功能,这些功能在其他市售机器中并未广泛共享。当测序以聚合酶的速率发生时,它会产生动力学数据,从而允许检测修饰的碱基[84]。PacBio机器还能够产生令人难以置信的长读,最大长​​度可达10 kb,甚至超过10 kb,可用于从头基因组组装[73][81]

    1. 下载:下载高分辨率图像(284KB)
    2. 下载:下载全图

    图3。第三代DNA测序核苷酸检测。(a):PacBio测序仪中的零模式波导(ZMW)中的核苷酸检测。将DNA聚合酶分子连接到每个ZMW(*)的底部,并添加目标DNA和荧光核苷酸。由于直径比激发光的波长窄,照明会迅速衰减并沿ZMW上行:聚合过程中掺入的核苷酸 在ZMW的底部提供实时荧光信号猝发,而不会受到溶液中其他标记dNTP的过度干扰。(b):ONT的MinION测序仪中使用的纳米孔DNA测序。双链DNA被进行性酶(†)变性,该酶通过嵌入合成膜中的生物纳米孔(‡)棘轮中的一根链,跨过施加电压。当ssDNA通过纳米孔时,不同的碱基以独特的方式阻止了离子流动,从而允许通过监测每个通道的电流来推断分子的序列。

    也许第三代DNA测序开发最令人期待的领域是纳米孔测序的前景,它本身是使用纳米孔检测和定量所有形式的生物和化学分子的更大领域的分支[85] 。纳米孔测序的潜力甚至在第二代测序出现之前就已经建立,当时研究人员证明,单链RNA或DNA可以通过电泳通过大的α-溶血素离子通道 穿过脂质双层。此外,通过通道会阻止离子流,从而在一段与核酸长度成比例的时间内降低电流[86]。也有可能使用非生物的固态技术来产生合适的纳米孔,这也可能提供对双链DNA分子进行测序的能力[87][88]。牛津纳米孔技术(ONT),第一公司发行纳米孔定序器,已产生的兴奋大量在其纳米孔平台GridION和仆从(图3 b)中[89] [90] ,其中后者是一种小型,手机大小的USB设备,该设备在2014年的抢先试用中首次发布给最终用户[91]。尽管目前观察到的公认质量差的型材,它希望这种定序器在DNA测序字段代表一个真正破坏性技术,产生令人难以置信的长读(无放大)序列数据更便宜和更快比以前可能[92] [ 90][85] 。MinIONs已被单独用于产生细菌基因组参考序列[93][94]和靶向扩增子 [95][96]或用于产生支架以将Illumina的读图映射至[97][98][96]结合了纳米孔技术的超长读取长度和短读取测序所提供的高读取深度和准确性。MinION机器的快速运行时间和紧凑的特性也为分散排序提供了机会,从而摆脱了当今常见的核心服务。正如今年早些时候Joshua Quick和Nicholas Loman在样本采集两天后在几内亚对埃博拉病毒进行测序时所证明的那样,它们甚至可以在野外部署[99]。因此,纳米孔测序仪不仅可以彻底改变可以产生的数据的组成,而且可以彻底改变在何处,何时何地以及由谁生产。

    5 。结论

    很难夸大DNA测序对生物学研究的重要性。在最基本的层面上,这是我们如何测量主要属性之一,通过它可以定义和区分陆地生命形式。因此,在过去的半个世纪中,来自全球的许多研究人员投入了大量的时间和资源来开发和改进支持DNA测序的技术。在该领域的起源上,研究人员将主要花费可访问的RNA靶标进行数年的艰苦努力,以产生可能从十几个核苷酸到一百个核苷酸的序列在长度上。多年来,测序协议,分子生物学和自动化技术的创新提高了测序技术的能力,同时降低了成本,从而使DNA可以读取数百个碱基对,并大规模并行化以一次生成千兆位数据。研究人员从实验室转移到计算机,从浇灌凝胶到运行代码。基因组被解码,论文发表,公司开始-通常后来被解散——DNA序列数据的存储库一直在增长。因此,DNA测序(在许多方面都是相对较新的且前瞻性的研究学科)具有悠久的历史。对这段历史的了解可以帮助您了解当前的方法,并为以后的方法提供新的见解,

     

    参考文献

    [1]

    F. 桑格弗雷德里克·桑格(Frederick Sanger)-传记
    (1980年)

    [2]

    J. 沃森,F. 克里克核酸的分子结构
    自然,171 (1953年),第709 - 756

    [3]

    DT· 扎伦尽管有富兰克林的工作,威尔金斯还是获得了诺贝尔奖
    自然,425 (2003 ),p。15
    展开全文
  • bioedit DNA序列分析

    2012-11-12 17:24:30
    DNA测序后用来分析序列用 bioedit DNA序列分析
  • DNA 测序技术

    2019-05-20 16:44:31
    DNA 测序技术用以分析特定DNA 片段的碱基序列(腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)与鸟嘌呤(G))的排列方式. 图2 DNA 测序及拼接过程示意图 Fig. 2 Diagram of DNA sequencing and assembly 测序完成后...

    DNA 测序技术用以分析特定DNA 片段的碱基序列(腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)与鸟嘌呤(G))的排列方式.

    图2 DNA 测序及拼接过程示意图
    Fig. 2 Diagram of DNA sequencing and assembly

    测序完成后的第一步也是最重要的一步就是根据读序拼接回贴成完整的序列,其测序与拼接过程如图2 所示.

    拼接算法用于将测出的读序拼接成完整的染色体序列(chromosome sequence)、转录本序列(transcript sequence)或因为测序不完整而形成的支架序列(scaffolds),最终形成基因组、转录组序列或其他功能序列. 所有的拼接算法基本上是先将读序根据重叠关系连接成“叠连群”(contigs),然后再将叠连群根据配对(pair-end)读序和其他信息形成有序集合来构建更长的支架序列.

     

     

    第三代测序纠错算法
    第三代测序技术解决高错误率策略主要有2 个:
    (1)利用来自另一个测序平台的低错误率的短读序,在保证足够的覆盖倍数下,纠正长读序中的错误,该类方法称为混合法;(2)利用长读序的错误分布比较均匀的事实,在保证长读序足够的覆盖率下,利用长读序自身的信息进行纠错,该类方法称为长读序自纠错方法.
    目前,针对PacBio 长读序的纠错算法有:

    (1)自纠错方法:DAGCon[67]、PBcR[64]、LoRMA[68];

    (2)基于短读序
    的纠错方法:PBcR[64]、LSC[69]、PacBioToCA[70]、proovread[71]、ECTools[72]、Cerulean[73]、LoRDEC[74]、Jabba[75]. DAGCon 的主要思想是通过长读序间的多对多比对进行自身纠错.

    PBcR 的主要思想是通过长读序间的局部比对构建多重序列比对,然后生成共有序列来进行纠错. PBcR的最新版本既支持长读序的自纠错,也支持基于短读序的纠错. LSC 的主要思想是先将长读序中相同的碱基压缩,然后再将短读序比对到长读序,利用比对结果对长读序进行纠错. PacBioToCA 直接将短读序比对到长读序上,利用比对结果对长读序进行纠错.

    展开全文
  • DNA序列

    2014-03-10 09:31:24
    众所周知,对于任意两个人来说,他们的染色体上的DNA序列大部分是相同的(否则就不是同一物种了),但是总会有少数碱基对不相同(否则世界上的人长得都一模一样了)。碱基的不同是由于基因的变异引起的。例如在某个...
    /*问题描述
     人类基因组计划的第一阶段于2000年6月26日胜利结束,我国的科研工作者圆满地完成了其中的1%的测序工作。
     众所周知,对于任意两个人来说,他们的染色体上的DNA序列大部分是相同的(否则就不是同一物种了),但是总会有少数碱基对不相同(否则世界上的人长得都一模一样了)。碱基的不同是由于基因的变异引起的。例如在某个人的DNA序列中,一位点上A突变成G。但每个人的DNA序列的变异位置都是不尽相同的。这样,对于大部分位点来说,很有可能是这么一种情况:大部分人在这个位点上的碱基是一致的(因为没有发生变异),少数人具有不同的碱基(因为发生了变异)。
     这样就给我们一个启发:在测序的过程中,如果仅仅使用一个人的样本的话,在很多位点上测出的结果就不具有代表性;如果能够测出多个人的序列,那么就有可能“整合”出一段具有人类共性的序列出来,这样更有利于研究。
     比如说,我们要测人的某一段的DNA序列,得到了4个人的样本:
     AAAGGCCT
     AGAGCTCT
     AAGGATCT
     AAACTTCT
    
     按照如下:
     1、 取出在每一个位置上出现次数最多的碱基作为整合后该位置上的碱基
     2、 如果有一个位置上出现次数最多的碱基不止一种,那么在出现次数最多的碱基中,优先选择A,其次C,再次G,最后T。
     按照上边的规则,整合后的序列为:
     AAAGATCT
     输入格式
     输入数据的第一行是一个数字N(2<=N<=10),代表DNA序列的个数
     接下来有N行,每行都是一个由AGCT组成的字符串,代表每个DNA序列,保证这些序列拥有相同的长度
     序列的长度在2到100之间
     输出格式
     仅输出一个字符串,代表整合后的DNA序列
     样例输入
     4
     AAAGGCCT
     AGAGCTCT
     AAGGATCT
     AAACTTCT
     样例输出
     AAAGATCT*/
    import java.util.*;
    
    public class Main {
    	public static char[] ch = { 'A', 'C', 'G', 'T' };
    	public static int[] sum;
    	public static int n;
    	public static String[] str;
    	public static int[][] sum1;
    
    	public static void main(String[] args) {
    		Scanner sc = new Scanner(System.in);
    		n = sc.nextInt();
    		str = new String[n];
    		for (int i = 0; i < n; i++) {
    			str[i] = sc.next();
    		}
    		// 读取没一行的字符串的每一位字母
    		for (int i = 0; i < str[0].length(); i++) {
    			sum = new int[4];
    			for (int j = 0; j < n; j++) {
    				// 记录该字母出现的概率
    				if (str[j].substring(i, i + 1).equals("A")) {
    					sum[0]++;
    				} else if (str[j].substring(i, i + 1).equals("C")) {
    					sum[1]++;
    				} else if (str[j].substring(i, i + 1).equals("G")) {
    					sum[2]++;
    				} else if (str[j].substring(i, i + 1).equals("T")) {
    					sum[3]++;
    				}
    			}
    			int max = 0;
    			int index = 0;
    			for (int k = 0; k < 4; k++) {
    				// 找出出现字母的次数最多的下标值
    				if (max < sum[k]) {
    					max = sum[k];
    					index = k;
    				}
    			}
    			System.out.print(ch[index]);
    		}
    
    	}
    }

    展开全文
  • 第五章 结束语 生物信息学是计算机科学、数学、生物学等学科的新兴交叉学科,DNA序列测定是生物信息学研究的一项基础性工作。目前大规模全基因组序列测定中常采用shotgun和BAC测序方法,片段拼接是该方法中最关键...

    第五章            结束语

     

    生物信息学是计算机科学、数学、生物学等学科的新兴交叉学科,DNA序列测定是生物信息学研究的一项基础性工作。目前大规模全基因组序列测定中常采用shotgunBAC测序方法,片段拼接是该方法中最关键的一步。本文通过对一个完整的拼接程序集进行研究,掌握生物信息学领域特别是DNA测序技术方向的国内外研究现状;理解大规模全基因组测序方法及其主要流程比较详细的介绍了BACWGS测序策略的DNA拼接算法,并通过对源代码和运行结果的分析,提出了对程序并行化的想法。

    对与我个人来说,最大的收获也许不是对于生物信息学知识的掌握,更重要的是让我掌握一种科学研究的方法。刚开始对于生物信息学,我完全是门外汉。通过这次毕业设计,使我明白了对于一个项目的研究应该如何开始,如何进行资料的收集,如何进行知识的储备;当遇到问题的是后应该如何去解决,特别是知道当问题比较棘手的时候,可以写E-mail给国外专家求助,并且他们也都回答了,这是我以前想都不敢想的。这些经验将在我以后的人生道路上起到非常重要的作用。

    致谢

     

    首先,我要向我的导师骆志刚教授致以真心的感激和崇高的敬意。在课题的研究过程中,骆老师给予了我大量的指导和建议。骆老师严谨的治学态度、开创性的思维以及渊博的知识、深厚的学术造诣,都使我受益匪浅而又终生难忘.。然而,最使我感动的是他为人宽容又极富责任心。骆老师平时工作十分繁忙,经常出差外地。当在毕业设计上有什么疑问的时候,我每次电话打过去,无论骆老师是在外地还是在开会,都会耐性的解答我的问题。这一点令我十分感动。我真心希望在以后的人生道路上,骆老师永远都是我的良师益友!

           其次,感谢重点实验室方小永博士。方师兄为人诚恳,虚心待人,治学严谨,工作负责。在进行毕业设计的这段时间里,每周方师兄都会约我找他进行工作汇报,详细的询问我的工作进度,耐性解答我的各种疑问,认真规划我下一步的工作进度。在我的研究和论文的撰写过程中给与了我极大的帮助。在此,我要真诚感谢他的提携!

     

    展开全文
  • A1051. DNA序列

    2018-02-28 20:50:00
     众所周知,对于任意两个人来说,他们的染色体上的DNA序列大部分是相同的(否则就不是同一物种了),但是总会有少数碱基对不相同(否则世界上的人长得都一模一样了)。碱基的不同是由于基因的变异引起的。例如在...
  • 第一章 基因组测序DNA序列拼接简介 2.1 基因组测序与序列拼接算法研究 2.1.1 基因组的概念 众所周知,生物由细胞组成,而细胞中含有一种与遗传有关的高分子化合物,称为脱氧核糖核酸(DNA)。DNA的基本组成...
  • 高通量测序技术产生的DNA序列数据长度较短,而且数据量非常巨大。分析了高通量测序环境下大数据的挑战和机遇,总结并讨论了数据压缩、宏基因组数据序列拼接、宏基因组数据序列分析方面的算法和工具等研究成果。最后...
  • DNA序列 变体数据库 重要的论文 然而,在这项研究中,我们表明假阳性变异体可占鉴定出的体细胞变异体的70%以上,这使得常规检测方法不足以准确确定低等位基因变异体。 有趣的是,这些假阳性变体主要来自诱变性DNA...
  • DNA序列分析软件 DNAssit 3.10 可用于64位windows,DNAssist可不仅仅是对测序结果的。它处理我们平常需要的一些关于DNA,RNA和蛋白质的基本数据,对表达非常有帮助。这里用一个例子来说明它的功能。主要演示①对测序...
  • 使用机器学习进行DNA测序 双螺旋是DNA的正确化学表示。 但是脱氧核糖核酸是特别的。... 因此,在这里,我们将了解DNA结构以及如何使用机器学习来处理DNA序列数据。 前提条件: Biopython :是python模块
  • 第一章 Atlas的安装与调试 3.1 程序的获得 Atlas是一个用于大型基因序列拼接的程序,可以用于全基因shotgun序列拼接(WGS),也可以用于BAC和WGS混合read的拼接。使用这个系统已经成功完成老鼠,蜜蜂,海胆,牛...
  • 该信号会被实时分析,用以确定正在通过纳米孔的DNA或RNA链的碱基序列。 英国牛津纳米孔公司 新型纳米孔测序法(nanopore sequencing)是将人工合成的一种多聚合物的膜浸在离子溶液中,多聚合物膜上布满了经改造的穿...
  • 第四章 Atlas程序的分析与改进 4.1 数据的准备 一个完整的拼接程序应该分为两个部分,一个是数据的准备,另一个是数据的拼接。...无论是全序列shotgun(WGS)还是BAC,都无法避免的引入污染。所以必须
  • 第一章 概述 1.1 什么是生物信息学 1.1.1 前言 2000年6月26日是人类科技史上一个令人难忘的日子,参加者人类基因组计划研究,美国、...已给制出人体97%的基因组,基中85%的基因组序列得到了精确测定,包含了人体
  • SMALT将DNA测序读数与基因组参考序列比对。 它采用哈希与动态编程相结合的方式。
  • 文件中的序列片段提取出来(这里就利用了前面的所构造的索引)。把这些 read 送到 Phrap 中完成局部的拼接,形成 contigs 。然后把这些 contigs 连接成 scafflod 。   4.4   关键技术研究   ...
  • 自动测序技术的普及应用以及各种模式生物基因组研究的广泛开展,一个典型的基因测序中心每年就要产生 1014 字节的原始数据,大量序列片段的拼接( fragment assembly )及数据和结果的可视化需要高效快速的算法和...
  • 首页地址 http://blog.csdn.net/zhanghu1228/http://blog.csdn.net/zhanghu1228/archive/2005/06/25/402990.aspxhttp://blog.csdn.net/zhanghu1228/archive/2005/06/25/402994.aspx还有好几篇
  • 从脱脂测序数据中分离快速进化的内部转录间隔区(ITS)区域的用户友好管道
  • 求两个DNA序列的最长公共子序列

    千次阅读 2020-04-08 17:29:18
    新冠状病毒的基因序列 2019年12月下旬,武汉出现了...为了弄清新型冠状病毒的起源,中国疾控中心等机构的研究人员对住院患者的样本进行高通量测序,获得了完整和部分的2019-nCoV基因组序列。接着对这些2019-nCoV基因...
  • 自上1953年DNA分子双螺旋结构被发表以来,生物学研究进入到了一个更精细化的分子时代,越来越多的科学家开始投入分子生物学研究,尤其是对DNA序列的研究,从而DNA测序技术应势而生。从1977年Sanger牛刀小试的双脱氧...
  • 指将物种细胞里面完整的基因组序列全部DNA,检测并排列,此技术几乎能够鉴定出基因组上任何类型的突变。 对于人类来说,全基因组测序的价值是极大的,它的信息包含了所有基因和生命特征之间的内在关联性,当然也...
  • 本研究采用PCR直接测序方法测定了五倍子蚜10个种共19个样本的mtDNA COI基因部分DNA序列(660bp),从GenBank下载瘿绵蚜科Pemphigidae瘿绵蚜属Pemphigus、卷叶绵蚜属Prociphilus和棉蚜属Eriosoma及纩蚜科Mindaridae纩蚜...
  • Chromas是一款专业好用的DNA测序分析软件,使用这款软件可以方便用户对DNA的峰形图进行查看和编辑操作,软件支持ab1、scf以及ztr格式的图谱文件,并支持自动删除低质量序列(当质量数据可用时)或矢量序列,除此之外...
  • 基因测序方法的分类,及序列拼接方法的综合介绍。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 408
精华内容 163
关键字:

dna序列测序