精华内容
下载资源
问答
  • 一款DNA序列比对软件,可用于DNA序列的分析、比对,酶切位点的查找等。
  • 用于序列比对器的多平台体系结构(MASA)是一种灵活的软件框架,可简化在多个硬件/软件平台中创建DNA序列比对应用程序的过程。 该框架支持将巨大的DNA序列与超过2亿个碱基对(MBP)进行比对。 MASA-Core库基于...
  • JFinisher是用于比对,编辑和操纵生物序列软件。 它旨在帮助完成基因组组装。 从参考序列开始,程序使用Smith-Waterman局部比对算法和辅助方法对重叠群进行比对,从而可以管理所产生的比对。 它具有图形界面,可...
  • DNA序列分析软件 DNAssit 3.10 可用于64位windows,DNAssist可不仅仅是对测序结果的。它处理我们平常需要的一些关于DNA,RNA和蛋白质的基本数据,对表达非常有帮助。这里用一个例子来说明它的功能。主要演示①对测序...
  • MashMap实现了一种快速且近似的算法,用于计算长DNA序列之间的局部比对边界。 对于将基因组装配或长读(PacBio / ONT)映射到参考基因组可能很有用。 给定最小对齐长度和所需局部对齐的同一性阈值,Mashmap使用k -...
  • 序列比对与Clustal的使用以及各类常见的序列分析工具介绍 内容提要 第一部分多序列比对 意义方法算法 Clustal的使用 1.Clustalx 2.Clustalw 第二部分常见的序列分析软件分类简介 第一部分 多序列比对及Clustal的...
  • CUDAlign是一种工具,可以使用Smith-Waterman算法与Myers-Miller结合使用,在CUDA GPU中比对大小不受限制的成对DNA序列。 使用GTX 560 Ti,可以在45秒内产生100万个碱基序列的最佳比对。 正在为此软件开发许多优化。...
  • 一个很不错的DNA序列分析软件,集序列比对、进化树构建于一身。
  • RNA序列转DNA序列

    2020-06-01 22:21:25
    silva数据库中用的是RNA序列,我们将其转换成DNA序列。因为大部分软件都支持正反链比对,我们没必要一定要负链序列,正链序列只要把U转换成T即可,利用R实现如下: read.table("SILVA_132_LSURef_tax_silva.fasta...

    silva数据库中用的是RNA序列,我们将其转换成DNA序列。正链序列只要把U转换成T即可(大部分软件都支持正反链比对),利用R实现如下:

    read.table("SILVA_132_LSURef_tax_silva.fasta",header=F,sep="&")->rna #sep随便搞个文件里没有的符号,只要不让它变成2列就成
    
    for (i in 1:dim(RNA)[1])
    {
    if (grepl(">",RNA[i,])){write.table(RNA[i,],file="silvaLSU132.dna.fa",append=T,sep=" ",row.names=F,col.names=F,quote=F)}
    else{write.table(gsub("U","T",RNA[i,]),file="silvaLSU132.dna.fa",col.names=F,row.names=F,quote=F,append=T)}
    } 
    #grepl,判断字符串中是否包含特定字符

    R的for循环贼慢,建议用bash实现

    a=$(grep -n "^[^\>]" test.txt| cut -d ":" -f 1) #查找不以>开头的行并返回行号,-d自定义分割符,-f 1截取第一个元素
    for i in $a; do sed -i "$i"'s/U/T/g' test.txt; done  

     

    展开全文
  • GenNon-H是第一个设计用于在系统树上的离散时间马尔可夫过程下生成多个序列比对的软件包,该序列直接从过渡矩阵采样。 基于输入模型和Newick格式的系统发育树(测得的分支长度为每个位点的预期取代数),该算法可...
  • DIAMOND是用于蛋白质和翻译后的DNA搜索的序列比对器,旨在用于大序列数据的高性能分析。 主要功能是: BLAST以100x-10,000x的速度对蛋白质和翻译的DNA进行成对比对。 移码比对,用于长时间阅读分析。 资源需求低...
  • 本文从NCBI数据库下载具有完整基N组序列的布尼亚科病毒的5个属20种病毒的序列,用生物学软件DNAman,DNAstar进行比对分析,发现布尼亚科病毒属中的植物病毒在核酸序列及蛋白结构上与动物病毒有很大差异:(1)只有...
  • DNAstar生物学软件

    2012-10-05 16:28:18
    DNAstar生物学软件DNA序列比对,DNA序列翻译,序列的反向互补及反向转换
  • 基因序列分析软件

    2013-04-17 12:56:09
    一款分析DNA序列的实用软件。DNAman 序列比对,序列分析,引物设计,d质粒绘图
  • 在保守的区域中以混合物种的比对找到简并引物 Swift将核苷酸翻译成氨基酸 各种视觉提示来突出共识字符或偏离共识的字符 简单复制/粘贴/删除/删除序列/文件 一个非常简单易用的“外部接口”,使您可以调用其他喜爱的...
  • vector NTI11 使用教程

    2014-06-30 22:07:03
    DNA序列比对软件,用于序列比对很有用,比DNAstar软件好用些
  • dnastar设计

    2018-04-17 15:25:42
    dnastar一共有6个子软件,主要可用于基因工程设计,基因编辑,引物设计,序列比对等等
  • 程序“ bam2mpg”从单倍体或二倍体DNA的序列读取中调用基因型与密切相关的参考序列比对。 该程序读取BAM中的对齐方式格式( )。 MPG (最有可能的基因型)算法基于贝叶斯模型,该模型可模拟一个或两个等位基因的...
  • 1.bowtie 短序列比对工具,blast也是短序列比对工具,速度快,结果易理解。 输入可以是fastq或者...将DNA序列比对到参考基因组上的软件,包含三种算法: BWA-backtrack:适合比对长度不超过100bp的序列; BWA...

    1.bowtie

    短序列比对工具,blast也是短序列比对工具,速度快,结果易理解。

    输入可以是fastq或者fasta文件。

    生成比对结果文件sam格式的吧。

    2.bwa

    转自:https://www.jianshu.com/p/1552cc6ac3be

    将DNA序列比对到参考基因组上的软件,包含三种算法:

    BWA-backtrack:适合比对长度不超过100bp的序列;

    BWA-SW:合于长度为70-1M bp的序列;

    BWA-MEM:合于长度为70-1M bp的序列,高质量的测序数据,其比对的速度更快,精确度更高。

    使用whereis bwa找到其安装路径:

    xhs@dandan26:/data1/zzl$ whereis bwa
    bwa: /usr/bin/bwa /usr/share/bwa /usr/share/man/man1/bwa.1.gz

    输入bwa得到以下帮助:

    Usage:   bwa <command> [options]
    
    Command: index         index sequences in the FASTA format
             mem           BWA-MEM algorithm
             fastmap       identify super-maximal exact matches
             pemerge       merge overlapping paired ends (EXPERIMENTAL)
             aln           gapped/ungapped alignment
             samse         generate alignment (single ended)
             sampe         generate alignment (paired ended)
             bwasw         BWA-SW for long queries
    
             shm           manage indices in shared memory
             fa2pac        convert FASTA to PAC format
             pac2bwt       generate BWT from PAC
             pac2bwtgen    alternative algorithm for generating BWT
             bwtupdate     update .bwt to the new format
             bwt2sa        generate SA from BWT and Occ
    
    Note: To use BWA, you need to first index the genome with `bwa index'.
          There are three alignment algorithms in BWA: `mem', `bwasw', and
          `aln/samse/sampe'. If you are not sure which to use, try `bwa mem'
          first. Please `man ./bwa.1' for the manual.

     步骤:

    1.对参照基因组建索引:

    bwa index –a bwtsw hg19.fasta

     

    此处构建索引使用的是bwtsw算法,最终输出的结果文件:

    会生成:bwt,pac,ann,amb,sa五种类型的文件:

    xhs@dandan-PowerEdge-T620:/data1/GRCm38$ ls
    GRCm38_68.fa  GRCm38_68.fa.amb  GRCm38_68.fa.ann  GRCm38_68.fa.bwt  GRCm38_68.fa.fai  GRCm38_68.fa.pac  GRCm38_68.fa.sa

     

    2.使用bwa-mem算法进行比对:

    bwa mem –t 4 hg19.fasta read1.fq read2.fq > aln-pe.sam

    我使用了这条命令:

    bwa mem -t 4 ../hg19/hg19.fasta ERR580012_1.fastq.gz ERR580012_2.fastq.gz > aln-pe.sam

     

    使用了mem算法,-t是选择几个线程,增加线程,减少运行时间;然后是参照基因组的fasta文件。以及其他参数:

    -p 忽略第二个输入序列,默认情况下,输入一个序列文件认为是单端测序,输入两个序列文件则是双端测序,加上这个参数后,会忽略第二个输入序列文件,把第一个文件当做单端测序的数据进行比对;

    将最终结果存入到了sam文件中。

    那么什么是单端测序和双端测序:

    转自:https://www.cnblogs.com/Formulate0303/p/7843082.html 

    1、单端测序(Single-ead)首先将DNA样本进行片段化处理形成200-500p的片段,引物序列连接到DNA片段的一端,然后末端加上接头,将片段固定在flowcell上生成DNA簇,上机测序单端读取序列。

    2、Paied-end方法是指在构建待测DNA文库时在两端的接头上都加上测序引物结合位点,在第一轮测序完成后,去除第一轮测序的模板链,用对读测序模块(Paied-End Module)引导互补链在原位置再生和扩增,以达到第二轮测序所用的模板量,进行第二轮互补链的合成测序。

     //其实这个第二点还不太明白.[1]

    3.将sam文件压缩为bam格式

    samtools view –bS aln-pe_reorder.sam –o aln-pe.bam

     

     查找samtools帮助:

    Usage:   samtools <command> [options]
    
    Command: view        SAM<->BAM conversion
             sort        sort alignment file
             mpileup     multi-way pileup
             depth       compute the depth
             faidx       index/extract FASTA
             tview       text alignment viewer
             index       index alignment
             idxstats    BAM index stats (r595 or later)
             fixmate     fix mate information
             flagstat    simple stats
             calmd       recalculate MD/NM tags and '=' bases
             merge       merge sorted alignments
             rmdup       remove PCR duplicates
             reheader    replace BAM header
             cat         concatenate BAMs
             bedcov      read depth per BED region
             targetcut   cut fosmid regions (for fosmid pool only)
             phase       phase heterozygotes
             bamshuf     shuffle and group alignments by name

     

    -b 表示输出为bam文件格式 –S默认下输入是 BAM 文件,若是输入是 SAM 文件,则最好加该参数,否则有时候会报错。-o 输出文件名

    最终生成了bam文件,其中b指binary,运算快。

    使用下面命令来查看文件头:

    samtools view -H ESCell#8.sam

    3.下载并安装gatk

     对下载的进行解压。

    unzip filename.zip

     

    将本地文件传给服务器直接使用xftp-5软件即可。

    解压缩zp2类型压缩文件:

    tar -xjf GenomeAnalysisTK-3.3-0.tar.bz2

     

    首次运行命令,提示:

    ##### ERROR MESSAGE: Fasta index file /data/data0/rawdata/../hg19/hg19.fasta.fai for reference /data/data0/rawdata/../hg19/hg19.fasta does not exist. Please see http://gatkforums.broadinstitute.org/discussion/1601/how-can-i-prepare-a-fasta-file-to-use-as-reference for help creating it.

     

    有个关于参照组的.fai文件找不到,放进去了,然后又说没有dict文件

    ##### ERROR MESSAGE: Fasta dict file /data/data0/rawdata/../hg19/hg19.dict for reference /data/data0/rawdata/../hg19/hg19.fasta does not exist. Please see http://gatkforums.broadinstitute.org/discussion/1601/how-can-i-prepare-a-fasta-file-to-use-as-reference for help creating it.

     5. .fasta.fai文件

    查看其中的内容,每行都有5列

    name  序列长度(单位:bp)   offset(第一个碱基的偏移量,从0计数,换行符也进行统计)  LINEBASES (除了最后一行,其他代表序列的行的碱基数) LINEWIDTH(除了最后一行外, 其他代表序列的行的长度, 包括换行符, 在windows系统中换行符为\r\n, 要在序列长度的基础上加2)

    ***根据这个.fai 文件和原始的fastsa文件, 能够快速的提取任意区域的序列 。 

    转载于:https://www.cnblogs.com/BlueBlueSea/p/9858814.html

    展开全文
  • DNAstar使用说明

    2010-06-25 20:55:59
    Lasergene由8个模块使用户能完成序列分析的每个步骤,包括从整理组装序列数据到发现基因、注释、基因产物分析、序列相似性搜寻、序列比对、进化树分析、寡核苷酸引物设计、克隆策略、结果发表等。Lasergene软件包...
  • 采用GenScan、Blast 2.1、ORF finder和Clustal W等软件分别对DNA序列进行预测、相似性比较、ORF查找以及多序列比对,并利用PredictProtein软件对蛋白质进行预测和结构分析.结果表明;PCR扩增所得DNA序列长度为957bp...
  • dnaman生物软件

    2013-09-23 22:12:12
    dnaman 生物软件 DNA蛋白质序列分析,比对
  • 人源化小鼠模型_DNA序列分析 概述 我们正在使用Bowtie2软件将DNA-seq与人类基因组和小鼠基因组进行比对。 完成比对后,我们将删除那些映射到人和小鼠基因组的读段,然后使用软件管道MetAMOS对其余的读段进行组装,...
  • 本文的主要工作是通过研究序列比对算法,实现一个cDNA/mRNA序列与DNA序列的跨物种比对软件XAT(cross-Alignment Tool)。本文主要借鉴了blastz软件的跨物种方法和sim4软件的intron与exon的边界确定方法。本文实现的方法...
  • DNAman 5.0 win7兼容

    2013-04-05 11:47:33
    生物医疗行业常用于DNA、RNA、蛋白序列序列比对软件
  • [目的]克隆条锈菌诱导的小麦过敏性反应(Hypersensitive induced reaction, HIR)基因TaHIR4,分析其编码蛋白的结构、进化与功能。【方法】采用电子克隆、RT-PCR...采用DNASTAR软件分别进行氨基酸序列同源性比对和进化树
  • 生信软件安装

    2018-08-16 10:45:00
     1)Blat:全称 The BLAST-Like Alignment Tool,可以称为"类BLAST 比对工具",对于DNA序列,BLAT是用来设计寻找95%及以上相似至少40个碱基的序列。对于蛋白序列,BLAT是用来设计寻找80%及以上相似至少20个氨基酸的...

     

    二、比对

     1)Blat:全称 The BLAST-Like Alignment Tool,可以称为"类BLAST 比对工具",对于DNA序列,BLAT是用来设计寻找95%及以上相似至少40个碱基的序列。对于蛋白序列,BLAT是用来设计寻找80%及以上相似至少20个氨基酸的序列。

      Blat 的主要特点就是:速度快,共线性输出结果简单易读。Blat 把相关的呈共线性的比对结果连接成为更大的比对结果,从中也可以很容易的找到 exons 和 introns。因此,在相近物种的基因同源性分析和EST 分析中,blat 得到了广泛的应用

      Blat的比对速度之所以能比Blast快几百倍,是因为此两者之间的比对机制有着本质的差别。Blast是将查询序列索引化,然后线性搜索庞大的目标数据库,期间频繁地访问硬盘数据,时间和空间上的数据相关性较小

      Blat则将庞大的目标数据库索引,然后线性搜索查询序列,这种搜索方式在时间和空间上的数据相关性比较大。

      Blat将数据库索引一次性读入内存,可以反复地高速调用,无需访问硬盘,占用的系统资源很少。只要索引建立,查询序列的量越大,Blat的优势就越明显。

    wget -c https://users.soe.ucsc.edu/~kent/src/blatSrc35.zip
    unzip blatSrc35.zip 
    cd blatSrc
    uname -a
    export MACHTYPE="x86_64"
    mkdir ~/bin/$MACHTYPE
    mkdir $MACHTYPE
    make
    

      注意:Why do I get the error "BLAT CALL FAILED!" even if I have put BLAT to my $PATH when I am running AlignGraph? The current version of BLAT (v35) is not compatible with AlignGraph, so you would have to use an earlier version to avoid this error. 

     

     2)AlignGraph:AlignGraph is a software that extends and joins contigs or scaffolds by reassembling them with help provided by a reference genome of a closely related organism.

    git clone https://github.com/baoe/AlignGraph.git
    

     注意:AlignGraph输入序列是fa格式的

     

     4)SPAdes:主要用于进行单细胞测序的细菌基因组组装,当然也能用于非单细胞测序数据。输入数据可以是 Illumina、IonTorrent reads,或 PacBio、Sanger reads,也可以把一些 contigs 序列作为 long reads 进行输入。该软件可以同时接受多组 paired-end、mate-pairs 和 unpaired reads 数据的输入:http://cab.spbu.ru/software/spades/

     

    #解压直接使用
    wget http://cab.spbu.ru/files/release3.12.0/SPAdes-3.12.0-Linux.tar.gz
    
    #老版本
    wget http://spades.bioinf.spbau.ru/release3.1.0/SPAdes-3.1.0-Linux.tar.gz
    

     

     5)QUAST :Quality Assessment Tool for Genome Assemblies

     

    wget https://downloads.sourceforge.net/project/quast/quast-5.0.0.tar.gz
    tar -xzf quast-5.0.0.tar.gz
    cd quast-5.0.0
    
    sudo python setup.py install#或者查看README.md查看安装信息 
    

     

     

    三、变异检测

     1)vt:A tool set for short variant discovery in genetic sequence data:https://github.com/atks/vt下载后make即可

     

    四、注释工具

     1)VEP注释工具:

      VEP(Variant Effect Predictor): 最初发布于2010年(PMID:20562413),16年(PMID:27268795)又发布了新的版本做了很大改进,现在主要可以进行序列变异和结构变异注释.(基于perl)

    wget https://github.com/Ensembl/ensembl-vep/archive/release/92.zip

      该软件的安装依赖于perl及perl模块DBI:

    wget https://cpan.metacpan.org/authors/id/T/TI/TIMB/DBI-1.641.tar.gz
    tar -xzvf DBI-1.641.tar.gz
    cd DBI-1.641
    perl Makefile.PL PREFIX=/perl/Module/DBI
    make 
    make test
    make install
    #然后
    cd VEP
    perl INSTALL.pl

     

     2)GEMINI:https://gemini.readthedocs.io/en/latest/ or https://github.com/arq5x/gemini

    git clone https://github.com/arq5x/gemini.git

      安装依赖好多包,而且也要升级包,升级方法去看我的博客Python文件夹,其中出现如下错误:

    #ImportError: Tornado requires an up-to-date SSL module. This means Python 2.7.9+ or 3.4+ (although some distributions have backported the necessary changes to older versions).
    #解决方法:https://stackoverflow.com/questions/51000512/import-error-tornado-requires-an-updated-ssl-module-on-ubuntu-14-04
    #不想更新python版本
    pip install tornado==4.*
    pip install jupyter
    

      其中依赖cyvcf2,该包安装成功,但import cyvcf2的时候报错:cyvcf2.so: undefined symbol: EVP_sha1

      排错过程比较纠结,但是可以尝试locate EVP_sha1,看是否出来了多条结果,尝试删除其他条,保留/usr/share/man/man3/EVP_sha1.3ssl.gz,sudo vi /var/lib/mlocate/mlocate.db去掉删除的其他条结果。然后再重新安装pip install cyvcf2

    gemini load --cores 4 -t snpEff -v RUN-CTRL14.snpeff.clean.vcf.gz gemini.db
    '''
    ValueError: GEMINI configuration file gemini-config.yaml not found in ['/usr/local/share/gemini', '/home/user01/.gemini'].
    Please ensure the GEMINI data is installed using the install-data.py script
    http://gemini.readthedocs.org/en/latest/content/installation.html
    '''
    #尝试
    sudo python gemini/install-data.py /usr/local/share/
    

       gemini需要grabix

    git clone https://github.com/arq5x/grabix.git
    make
    

      

     3)prokka:细菌基因组、宏基因组的基因注释

    git clone https://github.com/tseemann/prokka.git
    
    sudo apt-get -y install bioperl libdatetime-perl libxml-simple-perl libdigest-md5-perl
    
    #安装perl包XML
    sudo bash
    export PERL_MM_USE_DEFAULT=1
    export PERL_EXTUTILS_AUTOINSTALL="--defaultdeps"
    perl -MCPAN -e 'install "XML::Simple"'
    
    # 添加环境变量
    export PATH=$PATH:prokka/bin
    # 自动搜索并添加数据库
    prokka --setupdb
    # 测序数据库
    prokka --listdb
    

     

     4)InterVar:A bioinformatics software tool for clinical interpretation of genetic variants by the ACMG-AMP 2015 guidelines

    git clone https://github.com/WGLab/InterVar.git
    #安装使用后需要annovar软件,看云盘
    

      参考:http://www.sohu.com/a/126228397_152537

    转载于:https://www.cnblogs.com/always-fight/p/9485929.html

    展开全文
  • 利用CODEHOP(Consensus-DegenerateHybridOligonucleotidePrimers)软件设计了红色红...测序后进行BLASTX比对,发现此DNA产物与其他丝氨酸羧肽酶基因序列有相似性,推断所克隆的产物即为红色红曲霉的丝氨酸羧肽酶基因片段。
  • DNAssist软件使用教程

    2012-03-07 23:37:00
    DNAssist可不仅仅是对测序结果的。它处理我们平常需要的一些关于DNA,RNA和蛋白质的基本...主要演示①对测序报告(序列比对);②DNA的物化性质、限制性酶切位点图谱分析;③分析蛋白质的物化性质、抗原性、疏水性。

空空如也

空空如也

1 2 3
收藏数 46
精华内容 18
关键字:

dna序列比对软件