精华内容
下载资源
问答
  • 常用比对软件集合

    2021-11-02 09:29:27
    比对软件 来啦@-@,今天给大家分享一下几款小编常用的比对软件。 Bwa 适用范围:二代测序数据快速比对到genome上。 bwa作为序列比对界的模式软件,短小精悍,适用于多种场合,很有必要搞懂他内部的比对算法,最好也...

    比对软件

    来啦@-@,今天给大家分享一下几款小编常用的比对软件。

    Bwa

    适用范围:二代测序数据快速比对到genome上。

    bwa作为序列比对界的模式软件,短小精悍,适用于多种场合,很有必要搞懂他内部的比对算法,最好也搞懂它是如何实现的。

    建立索引:

    bwa index in.fasta
    

    索引建立好之后会生成五个文件,后缀分别是:

    bwt,pac,ann,amb,sa
    

    常见比对命令:

    BWA-backtrack:illumina reads比对,最长支持100bp(aln/samse/sampe)
    bwa aln ref.fa R1.fq > aln1_sa.sai
    bwa aln ref.fa R2.fq > aln2_sa.sai
    bwa sampe ref.fa aln_sa1.sai aln_sa2.saiR1.fq R2.fq > aln-pe.sam
    BWA-SW:long-read比对,长度为70bp-1Mbp;支持剪切性比对(bwasw)
    bwa bwasw ref.fa R1.fq R2.fq > aln-pe.sam
    BWA-MEM:最新,最常用,同SW,但更准更快,与backtrack相比在70-100bp更具性能优势(mem)
    bwa mem ref.fa R1.fq R2.fq > aln-pe.sam
    
    Bowtie/Bowtie2
    

    适用范围:将短序列拼接至模板基因组。

    Bowtie在拼接35碱基长度的序列时,可以达到每小时2.5亿次的拼接速度。Bowtie并不是一个简单的拼接工具,它不同于Blast等。它适合的工作是将小序列比对至大基因组上去。它最长能读取1024个碱基的片段。换言之,bowtie非常适合下一代测序技术。

    Bowtie2 是将测序reads与长参考序列比对工具。适用于将长度大约为50到100或1000字符的reads与相对较长的基因组(如哺乳动物)进行比对。Bowtie2使用FM索引(基于Burrows-Wheeler Transform 或 BWT)对基因组进行索引,以此来保持其占用较小内存。对于人类基因组来说,内存占用在3.2G左右。Bowtie2 支持间隔,局部和双端对齐模式。可以同时使用多个处理器来极大的提升比对速度。如果目的是与相对较短的参考序列(如细菌基因组)非常灵敏的比对,可以使用Bowtie 2完成,但您可能需要考虑使用NUCmer,BLAT或BLAST等工具。当参考基因组很长时,这些工具可能会非常缓慢,但当参考基因组很短时通常就足够了。

    建立索引:

    bowtie2-build genome.fa genome_index
    bowtie2 -p 10 -x genome_index -1 input_1.fq -2 input_2.fq | samtools sort -O bam -@ 10 -o - > output.bam
    

    需要注意的是:genome_index 指的是用于bowtie2的索引文件,而不是参考基因组本身,构建过程参考后文。genome_index 需要指定路径及其共用文件名

    RNA-seq比对软件

    RNA测序并不能直接使用DNA测序常用的BWA、Bowtie等比对软件,这是由于真核生物内含子的存在,导致测到的reads并不与基因组序列完全一致,因此需要使用Tophat/HISAT/STAR等专门为RNA测序设计的软件进行比对。

    01 Tophat2
    可以说是最被公认的RNA测序比对软件(实际上是在DNA比对软件Bowtie的基础上做了一个壳,tophat调用bowtie,tophat2调用bowtie2)。

    02 HISAT2

    在Tophat的算法基础了上做了大量的改进,而且克服了Tophat最大的缺点——速度慢(HISAT2既能做RNA-seq也能做DNA-seq)。
    ①Hisat是一种高效的RNA-seq实验比对工具
    ②它使用了基于BWT和Ferragina-manzini (Fm) index 两种算法的索引框架
    ③使用了两类索引去比对,一类是全基因组范围的FM索引来锚定每一个比对,另一类是大量的局部索引对这些比对做快速的扩展

    建立索引,它的索引就会以genome命名,以*.ht2结尾

    hisat2-build -f ref.fasta genome -p 10
    

    在这里插入图片描述

    而遇到一些大的基因组的时候我们需要用到一个命令参数–large-index,强制要求产生的索引为‘large’

    线程数比对基本的用法:

    hisat2 [options]* -x <ht2-idx> {-1 <m1> -2 <m2> | -U <r>} [-S <sam>]
    hisat2 -x genome -1 ./data/gpl/gpl_L4_383X83.R1.fastq.gz -2 ./data/gpl/gpl_L4_383X83.R2.fastq.gz -S  test.sam
    

    在这里插入图片描述

    03 STAR

    STAR (Spliced Transcripts Alignment to a Reference),用于将测序的 Read 对齐到参考基因组的比对软件,常用于 RNAseq。因其具有较高的准确率,映射速度较其他比对软件高 50 多倍,因此作为 ENCODE 项目的御用 pipeline 工具。它需要占用大量内存,对计算资源有较高的要求。STAR 的默认参数针对哺乳动物基因组进行了优化.

    建立索引:

    STAR --runMode genomeGenerate \
    --runThreadN 50 \
    --genomeDir ./hg38_index \
    --genomeFastaFiles ./genome.fa \
    --sjdbGTFfile ./genes.gtf \
    --sjdbOverhang 99
    

    参数:

    –runMode genomeGenerate:基因组生成模式
    –runThreadN:启用线程数
    –genomeDir:索引输出路径
    –genomeFastaFiles:参考基因组路径
    –sjdbGTFfile:参考基因组注释文件
    –sjdbOverhang:对于不同长度的读取,理想值为--sjdbOverhangmax(ReadLength)-1。在大多数情况下,默认值 100 与理想值类似。
    

    STAR 比对:

    STAR --outSAMtype BAM SortedByCoordinate \
    --runThreadN 20 \
    --genomeDir ./hg38_index \
    --readFilesIn  seq_data_1.fastq seq_data_2.fastq \
    --outFileNamePrefix ./seq_data
    

    参数:

    –runThreadN:启用线程数
    –genomeDir:索引路径
    –readFilesIn:输入 fastq 的文件路径
    –outSAMtype BAM SortedByCoordinate:输出排序的 bam 文件
    –outFileNamePrefix:输出文件前缀
    

    04 MapSplice

    TCGA使用的比对软件。

    05 RSEM

    RSEM更像一个软件包而不是一个比对软件,能够提供从比对到计算差异表达的所有步骤,由于不需要自己写代码串联不同软件生成的数据格式,因此用起来比较省时省力,值得注意的是,TCGA使用MapSplice比对后再用RSEM计算表达量,并没有直接只用RSEM原装的Bowtie的比对结果。

    ①比对软件(RNA-SEQ比对到参考基因组上):bowtie2 tophat hista2 star
    ②不需要比对(伪比对,基于建立好的参考转录组):sailfish kallsto salmon
    ③组装与定量:stringtie cufflink RSEM

    性能比较:

    ①tophat与Hista2算法相似,但是tophat已经不再维护,且比对速度方面,Hista2 显著高于 tophat。STAR与Hista2类似。
    ②Ballgown在差异分析方面比cuffdiff更高的特异性及准确性,且时间消耗不到cuffdiff的千分之一
    ③Bowtie2+eXpress做质量控制优于tophat2+cufflinks和bowtie2+RSEM

    长片段比对软件

    01 Minimap2

    Minimap2是针对于三代测序数据进行比对的工具,minimap2的优势是速度快,而且听说比对的结果也比较不错;缺点呢,就是耗费内存。基本用法如下:

    建立索引:

    minimap2 -d co92.min co92.fna
    

    比对:

    minimap2 -ax map-pb azyz.genome.fasta azyz.flnc.fasta > aln.sam
    

    分类:五大类,索引(Indexing),回帖(Mapping),比对(Alignment),输入/输出(Input/Output),预设值(Preset)。

    -x :非常中要的一个选项,软件预测的一些值,针对不同的数据选择不同的值
    map-pb/map-ont: pb或者ont数据与参考序列比对;
    ava-pb/ava-ont: 寻找pd数据或者ont数据之间的overlap关系;
    asm5/asm10/asm20: 拼接结果与参考序列进行比对,适合~0.1/1/5% 序列分歧度;
    splice: 长reads的切割比对
    sr: 短reads比对
    -d :创建索引文件名
    -a :指定输出格式为sa格式,默认为PAF
    -Q :sam文件中不输出碱基质量
    -R :reads Group信息,与bwa比对中的-R一致
    -t:线程数,默认为3
    

    02 ngmlr

    NextGenMap-LR(ngmlr)主要用于三代测序的长reads与参考基因组的比对。NGMLR是一款为长reads设计的快速且高精度的进行比对的软件,它是基于NGM开发的,该软件扩展了segmented convex gap-cost scoring model来适应高错误率的长reads比对。

    基本用法:

    ngmlr -r ucsc.hg19.fasta -q XXX.fastq -o YYY.bam
    

    下图是几款软件的比较:

    可以看出minimap2表现是十分良好的。
    在这里插入图片描述

    展开全文
  • 根据要比对的序列情况以及要达到的目的选择合适的比对软件是非常有必要的。对现有两序列比对的算法和常用软件进行归类和比较,为研究人员了解现今序列比对情况,筛选合适的比对算法和软件提供参考。
  • STAR (Spliced Transcripts Alignment to a Reference),用于将测序的 Read 对齐到参考基因组的比对软件,常用于 RNAseq。因其具有较高的准确率,映射速度较其他比对软件高 50 多倍,因此作为 ENCODE 项目的御用 ...

    零、介绍

    • STAR (Spliced Transcripts Alignment to a Reference),用于将测序的 Read 对齐到参考基因组的比对软件,常用于 RNAseq
    • 因其具有较高的准确率映射速度较其他比对软件高 50 多倍,因此作为 ENCODE 项目的御用 pipeline 工具。
    • 它需要占用大量内存,对计算资源有较高的要求。
    • STAR 的默认参数针对哺乳动物基因组进行了优化

    一、安装

    conda install -c bioconda star
    

    二、使用

    1、建立索引

    STAR --runMode genomeGenerate \
    --runThreadN 50 \
    --genomeDir ./hg38_index \
    --genomeFastaFiles ./genome.fa \
    --sjdbGTFfile ./genes.gtf \
    --sjdbOverhang 99
    

    参数:

    • –runMode genomeGenerate:基因组生成模式
    • –runThreadN:启用线程数
    • –genomeDir:索引输出路径
    • –genomeFastaFiles:参考基因组路径
    • –sjdbGTFfile:参考基因组注释文件
    • –sjdbOverhang:对于不同长度的读取,理想值为--sjdbOverhangmax(ReadLength)-1。在大多数情况下,默认值 100 与理想值类似。

    2、STAR 比对

    STAR --outSAMtype BAM SortedByCoordinate \
    --runThreadN 20 \
    --genomeDir ./hg38_index \
    --readFilesIn  seq_data_1.fastq seq_data_2.fastq \
    --outFileNamePrefix ./seq_data
    

    参数:

    • –runThreadN:启用线程数
    • –genomeDir:索引路径
    • –readFilesIn:输入 fastq 的文件路径
    • –outSAMtype BAM SortedByCoordinate:输出排序的 bam 文件
    • –outFileNamePrefix:输出文件前缀

    STAR 的默认参数针对哺乳动物基因组进行了优化。**其他物种可能需要对某些对齐参数进行重大修改,尤其具有较小内含子的生物,必须减小最大和最小内含子大小

    三、原理

    STAR 的比对算法需要两步:

    • 种子搜索
    • 聚类,拼接,评分

    种子搜索

    STAR 先搜索与参考基因组上,一个或多个位置完全匹配的最长序列。这些最长的匹配序列称为最大可映射前缀 (*Maximal Mappable Prefix,*MMP):

    image

    匹配到的 Read 的不同部分称为“seed”。所以对齐到基因组的第一个 MMP 称为seed1

    随后 STAR 将再次仅搜索读数的未映射部分,以找到与参考基因组完全匹配的下一个最长序列 MMP,即seed2,以此类推。

    image

    这种 Read 顺序搜索是 STAR 算法效率的基础。

    STAR 使用未压缩的后缀数组 (Suffix Array,SA) 来有效搜索 MMP,这允许针对最大的参考基因组进行快速搜索。其他较慢的比对软件使用的算法通常在拆分 Read 和执行比对之前搜索整个 Read 序列。

    意外情况是:

    • 由于不匹配或缺失,STAR 没有为 Read 的每个部分找到精确匹配的序列,则之前的 MMP 将被扩展。

    image

    • 如果延伸没有给出良好的比对,那么质量差或接头序列(或其他污染序列)将被软剪切。

    image

    聚类、拼接和评分

    基于与一组‘anchor’种子或非多重映射种子的接近程度将种子聚集在一起,将单独的种子聚集在一起以创建完整的读取。

    然后根据读取的最佳对齐方式将种子拼接在一起(基于不匹配、插入缺失、间隙等进行评分)。

    image


    https://github.com/alexdobin/STAR

    https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf

    https://academic.oup.com/bioinformatics/article/29/1/15/272537

    https://hbctraining.github.io/Intro-to-rnaseq-hpc-O2/lessons/03_alignment.html

    展开全文
  • 今天我们详细地给大家介绍一款必会比对程序BLAST的用法,再给大家说一说几种常用比对软件的优缺点,方便大家自己选择。BLAST(Basic Local Alignment Search Tool)可以说是短序列比对中最常用的比对工具了,它...

    作为一名生物科研狗,在饱受实验折磨的同时,相信大家也都多少会受到一些生信软件的“宠爱”比如需要做序列比对,却不知道该用什么软件,不知道怎么设参数、不懂怎么读结果。

    今天我们详细地给大家介绍一款必会比对程序BLAST的用法,再给大家说一说几种常用比对软件的优缺点,方便大家自己选择。

    BLAST(Basic Local Alignment Search Tool)可以说是短序列比对中最常用的比对工具了,它不仅支持核酸和蛋白的双序列比对,而且可以在蛋白质数据库或DNA数据库中进行相似性比较,找到与查询序列相似的序列。

    使用方法:

    B可以选择不同的比对选项,对应于我们前面介绍的五种功能

    D可以接受各种格式的查询序列,可以一个序列号(NM_000249)或者是FASTA序列

    E可以限定查询序列中的某个片段,比如“from 200 to 600”就是查询200-600bp位置的序列

    G可以选择进行多序列比对,并且可以更改序列输入方式

    A可以选择所要查询的数据库

    B可以输入物种名称,它会显示下拉条目可以进行选择

    C可以用来排除一些不想要的信息

    D对于特定数据库可以进行一些搜索限制,比如输入 “biomol_mrna【prop】 AND 【slen】”可以限制搜索500-1000bp长度的序列

    E可以根据需要选择不同的速度或者灵敏度

    F按钮执行BLAST搜索

    G可以打开一个折叠页面,可以进行更为详细的参数设置(如下图)

    H可以设定数据库中最大的匹配目标数

    I允许BLAST自动优化30个碱基/残基或更短的查询设置

    J是一个期望阈值的设置,可以过滤掉不太重要的匹配

    K设置初始序列匹配的大小,设置越小越敏感

    L限制了最大匹配数,默认设置“0”表示无限制

    F和G是得分参数,对BLAST的敏感度也会有影响,不过一般情况下可以设为默认值。

    比对结果:

    JobTitile默认情况下显示第一个查询的序列id,也可以提交前对其进行自定义。

    RID显示分配给此搜索的唯一标识符,Downlod ALL可以将完整的搜索结果保存为所需的格式XML (XML2)JSON和CSV

    Program列出进行的搜索,在本例中为BLASTN提供参考文献

    Database是搜索的数据库,可以查看详细信息

    Query ID显示结果的查询序列id

    Organism允许设置物种名

    Percent Identity 允许设置同一性程度进行过滤,比如94.74% 到94.76%

    E Value允许通过期望值进行过滤,比如设置0.0001 到 5e-120 (5x10-120).

    Description是BLAST结果默认显示选项,可以通过旁边的按钮切换

    以上结果是默认按E值由高到低进行排序的,单击后面的每条accession号可以直接跳转到对应的核酸库或蛋白库中。

    Distance tree of results可以以距离树的形式显示比对结果(如下图)如果比对的是蛋白序列的话还会有一个Multiple alignment用于发育分析。

    Alignments选项下包含查询序列和数据库序列之间的详细比对信息。

    BLAST功能强大,使用方便,但是也存在一些缺点,它的分析速度比较慢,比对结果现不够直观,不利于后续的处理,比对不能显示基因内含子、外显子及基因定位等等。

    BLAT(The BLAST-Like Alignment Tool)也是一款常用的序列比对工具,对于DNA序列,BLAT是用来设计寻找95%及以上相似至少25个碱基的序列。对于蛋白序列,BLAT是用来设计寻找80%及以上相似至少20个氨基酸的序列。

    BLAT也存在着一定的局限性,比如用于远亲缘物种间的核酸序列比对时,比对精度就不够高,建议使用专门为此用途的Blastz软件;对于少量的蛋白质比对任务(如数条或数十条)在速度和精度上Blastp均优于Blat;另外,Blat在重复搜索短小匹配片段的同时,会产生过多的没有生物学意义的序列比对碎片,一步分析确认。

    几个常用的多序列比对软件

    DANMAN是一个简单常用的核酸序列分析软件,它支持多序列比对、序列同源性分析、限制性酶切位点分析、PCR引物设计、质粒绘图等多种功能,并且是非常友好的Windows界面、软件占用内存小、兼容性也比较好,DNAMAN可以说是分子生物学人的必备工具之一了。

    Clustal是基于渐进比对的多序列比对工具,有应用于多种操作平台的版本,包括linux版,DOS版的clustlW,clustalX等。ClustalW不仅可以用来做多序列比对,也能做Profile-profile比对,以及基于Neighbor-joining方法构建进化树,是最常用的是多序列比对。但是由于它采用一种渐进的比对方法,不能保证能够得到最优的比对,而且速度也不够快。

    Muscle是一款速度最快的比对软件之一,在速度和精度上都优于ClustalW,可以比ClustalW的速度快几个数量级,而且序列数越多速度的差别越大。

    它采用迭代方法进行比对运算,每一次最优化过程就是迭代过程,通过不断地使用动态规划算法重排来纠正这种错误,同时对这些亚类群进行比较以获得所有序列地全局比对。但是Muscle地准确度降低了,并且对于内存的要求较高。

    本文相关词条概念解析:

    序列

    序列,被排成一列的对象。如DNA分子是由4种核苷酸(A,T,G,C)排列组成,DNA序列就是组成某一DNA分子的核苷酸的排列次序。在信息学里,序列表示离散时间信号。例如:物理信号x(n)等于单位阶跃序列u(n),即x(n)=u(n),其时序n表示记录物理信号的时间顺序,u(n)的波形下图所示。蛋白序列就是构成某种蛋白质如氨基酸线性排列次序。基因组中的DNA序列可以分为两大类:一类是单一序列,即在基因组中这种核苷酸的排列次序只出现一次或只有一份拷贝;另一类是重复序列。

    展开全文
  • 比对序列相似性模型直接采用序列自身的统计信息来计算序列之间的相似度,具有运算速度快、 聚.类结果准确等优点。提出一种基于位置信息的非比对序列相似性模型,通过提取 K 词模型中每个词的 Local Frequency( LF)...
  • Isaac 基因组比对软件 版权所有 (c) 2010-2014 Illumina, Inc. 保留所有权利。 该软件是根据 BSD 2-Clause License 的条款和条件提供的 您应该已经收到 BSD 2-Clause 许可证的副本以及该程序。 如果没有,请参阅 。...
  • 多序列比对软件Clustalw使用方法2011年06月23日星期四16:44Clustal的基本思想是基于相似序列通常具有进化相关性这一假设。比对过程中,先对所有的序列进行两两比对并计算它们的相似性分数值,然后根据相似性分数值将...

    多序列比对软件

    Clustalw

    使用方法

    2011

    06

    23

    星期四

    16:44

    Clustal

    的基本思想是基于相似序列通常具有进化相关性这一假设。比对过程

    中,先对所有的序列进行两两比对并计算它们的相似性分数值,然后根据相似性分

    数值将它们分成若干组,并在每组之间进行比对,计算相似性分数值。根据相似性

    分数值继续分组比对,直到得到最终比对结果。比对过程中,相似性程度较高的序

    列先进行比对,而距离较远的序列添加在后面。作为程序的一部分,

    Clusal

    可以

    输出用于构建进化树的数据。

    Clustal

    程序有许多版本,

    ClustalW(Thompson

    等,

    1994)

    ,根据对亲缘关系较

    近的序列间空位情况,确定如何在亲缘关系较远的序列之间插入空位。同样,相似

    性较高的序列比对结果中的残基突变信息,可用于改变某个特殊位置空位罚分值的

    大小,推测该位点的序列变异性。

    ClustalW

    是一种渐进的多序列比对方法,先将

    多个序列两两比对构建距离矩阵,反应序列之间两两关系

    ;

    然后根据距离矩阵计算

    产生系统进化指导树,对关系密切的序列进行加权

    ;

    然后从最紧密的两条序列开

    始,逐步引入临近的序列并不断重新构建比对,直到所有序列都被加入为止。

    ClustalX

    CLUSTAL

    多重序列比对程序的

    Windows

    版本。

    Clustal X

    为进行多

    重序列和轮廓比对和分析结果提供一个整体的环境。

    软件下载地址

    :

    使用步骤如下

    :

    Step 1:

    软件初始化界面

    展开全文
  • 比对软件DNAssist

    2014-10-31 22:48:14
    生物信息学,生物学专业比对软件,安全无毒,敬请放心下载使用
  • 这三个软件都需要把待blast的序列做成fa格式构建fa格式的序列如果有个待比对的序列是含有两列,其中包括第一列(ID),第二列(sequence)。如果需要形成fa格式的话,可以使用下面的linux代码awk '{print">"$1"\n"$2}'...
  • 生物信息分析中会用到很多的比对软件,比较常用的有bowtie、bowtie2、bwa等,比对文件的标准格式是sam格式,但是bowtie比对默认输出的格式却不是sam格式,由于bowtie适用于短序列比对,并且看突变碱基比较方便,因此...
  • 20201123-基因组比对分类及相关软件

    千次阅读 2020-11-23 18:29:54
    基因组比对分类及相关软件相关代码BWABowtie2LastZLast 什么是比对比对的英文是alignment,其对应的中文翻译可以是比对,联配,对齐,排列等,目前并没有一个统一的用词。中文文章中多见比对,联配。 序列比对...
  • ClustalW是现在用的最广和最经典的多序列比对软件, Muscle是速度最快的多序列比对之一,T-coffee是越来越受到欢迎的软件.它们各自有什么优点和缺点呢?ClustalW不仅可以用来做多序列比对,也能做Profile-profile比对,...
  • 在此基础上,根据相似性信息数据识别结果,建立全新的比对矩阵模型,并以此为条件,对检测数据库进行定容处理,实现信息相似性检测系统软件运行环境搭建,结合相关硬件执行结构,完成基于比对矩阵模型的信息相似性...
  • alfalfa:长片段比对软件

    千次阅读 2016-11-04 22:53:20
    随着三代测序的兴起,长片段比对需求增加。前面一直在用GMAP,这个软件有个缺点,一条带有polyA序列的可能比对不上参考序列,当把polyA去掉之后,又可以比对上。...今天发现一个新的长片段比对软件 alfalf
  • 一.序列比较 3 种常见的DNA序列替换... BLAST (两个核苷酸在比对时相同时得分为+5,反之为-4,此时比对效果较好) 3 种常见的蛋白质序列替换记分矩阵 等价矩阵 PAM矩阵 BLOSUM 上述PAM和BLOSUM比对使用方法 ...
  • 比对软件Blast,Blast+,Diamond如何选

    千次阅读 2019-12-02 16:40:55
    比对软件Blast,Blast+,Diamond比较 Blast (1)格式化数据库 formatdb -i db.seq -p T -o T -l logfile 主要参数: -i 输入需要格式化的源数据库名称 -p 文件类型,是核苷酸序列数据库(F - nucleotide)/蛋白质...
  • 以前,我都是经过PRANK软件进行多序列比对,然后再使用Gblocks软件对数据进行过滤的。现在,由于师弟师妹在拼接CDS序列时,有些碱基并不是保留3的倍数,造成很多编码序列出现移码突变,甚至变成了伪假基因(几百个...
  • muscle 软件进行多序列比对

    千次阅读 2017-06-27 14:20:00
    今天在使用muscle 软件进行多序列比对时,发现输出的结果全部为gap, 而且还没有明显的报错信息 找了很久之后,终于发现了问题 muscle 为了追求速度,对输入序列的个数和长度进行了限制 下面是官方说明文档中的原话:...
  • LASTZ-成对DNA序列比对器 该存储库包含LASTZ的最新官方工作分支。 正式发行带有标签,可以在找到。 鼓励用户使用带标签的发行版,因为此工作分支可能不稳定。 在撰写本文时,最新的正式版本是1.04.03版。 可以在 ...
  • 生物分析仪提供数据分析的一般方面,例如处理核苷酸数据,获取不同的数据格式信息,NGS质量控制,数据可视化,执行多序列比对和序列BLAST。 这些工具接受通用的生物数据格式,并且可以将人类可读的输出文件存储在...
  • 生信软件 | Blast (序列比对)

    千次阅读 2016-04-16 22:54:10
  • 转载:...mid=2247484731&idx=1&sn=b15fbee5910b36341bf366860ee5df53&scene=21#wechat_redirect 这次给大家带来的是ENCODE project的御用比对软件STAR,ENCODE项目...
  • Excel比对辅助工具使用说明书 1、 程序安装 双击前面图标可执行文件,可以直接运行使用。...6. 保存比对结果,错误位置(单元格)填充颜色(黄)批注错误信息; 7. IPAD2主题界面,隐藏式多功能按钮;
  • 软件连接:https://github.com/alexdobin/STAR/ 因为不连续的转录本结构,相对短的片段长度,和测序技术持续增加的通量,高通量RNA-seq数据的准确比对是一个有挑战性且仍未解决的问题。当前可用的RNA-seq比对器遭受...
  • 合同比对系统,告别人工比对,差异比对率100 场景一:人工合同比对 经理:我们和XX公司的合同落实的怎么样了?都已经一个星期了。 员工:XX公司改动过合同的内容,现在需要重新开始新一轮的合同审批,要经过...
  • Prodar是一个搜索应用程序,可查询PDB以获取候选结构比对。 搜索的输入是从标准(文本)PDB文件中读取的蛋白质骨架结构,返回的结果仅基于骨架的结构相似性,而与序列信息无关。 搜索速度非常快,通常不到一分钟即可...
  • EMBOSS下载: http://pan.baidu.com/s/1i4SS5E1 测试文件下载: http://pan.baidu.com/s/1mihF4xU ...2. 执行命令 ./configure 生成Makefile文件 ...EMBOSS软件包下的needleall软件 进入安装目录下...
  • 今天继续我们的生物信息就该这么学内容,其实生物信息分析每天做的工作就是各种比对。序列比对可以说是整个生物信息的核心,因为你会发现几乎每个生物信息分析过程都需要用到序列比对。判断两个基因或两段基因组片段...
  • 比对分值阈值默认是[30],即read比对得分值>=30,输出比对结果。 参数 默认 比对情况 分值 说明 -A [1] Match 1 1bp比对得1分 -B [4] Mismatch -4 1bp错配扣4分 -O [6,6] gap(ins,del) -6,-6 1bp的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 31,496
精华内容 12,598
关键字:

信息比对软件

友情链接: 2004112611133.rar