精华内容
下载资源
问答
  • 并行fastq转储 并行fastq-dump包装器 为什么和如何 即使您已经拥有更快的资源(网络,IO,CPU),即使您已经下载了sra文件,NCBI fastq-dump有时也会非常慢。 该工具通过将工作划分为多个线程来加快过程。 这是可能...
  • fastq-scan从 STDIN 读取 FASTQ 并以 JSON 格式输出汇总统计信息(读取长度、每次读取质量、每个碱基质量)。 快速扫描 我想要一种以 JSON 格式输出输入 FASTQ 的简单汇总统计信息的快速方法。 有(可能更好)的替代...
  • bam2fastq bam2fastq是一个从BAM文件中提取序列和质量的程序。 原始版本可以在找到。 随后对其进行了修改,以处理具有成对和不成对读和写到stdout混合的BAM文件。 安装 需要make,gcc和zlib压缩库-所有这些都应该...
  • Fastq过滤器-源码

    2021-02-08 03:53:47
    Fastq过滤器
  • 重写配对的末端fastq文件,以确保所有读取都具有配对并分离出单例。 这段代码做一件事:它需要两个fastq文件,并生成四个fastq文件。 是的,免费提供,使您拥有的fastq文件数量增加了一倍!! 通常,当您获得配对...
  • bcl_to_fastq运行带有可选效果的bcl2fastq到“样本表”,并将跨通道的读取按样本连接到R1和R2中。 默认情况下,成功时将删除各个通道的不确定和读取,并将所有读取放置在BaseCalls目录中。 在bcl2fastq2转换软件v...
  • fastQ-翻译器 试图用Python制作高效,准确的fastQ转换器。 资源: 方法 在该翻译程序的整个开发过程中,我一直在使用各种方法编写的Jupyter文件。 FastQ.py 我的BME160最终版本中的OG文件。 newFastQ.py 正在进行...
  • 维基百科:FASTQ格式

    2021-03-22 16:40:54
    来自维基百科中文版本的FASTQ文件格式介绍。由于维基百科被和谐了,特在此分享。
  • 解析fastq文件和处理illumina 1.8+ fastq序列的简单python 2.7库 创作时间:2015/04/02 最后更新 : 2015/04/02 快速阅读器 读取 fastq 文件并生成 FastqSeq 对象的迭代器的解析函数。 当文件为空时,生成器会引发...
  • <p>http://www.drive5.com/usearch/manual/cmd_fastq_stats.html http://www.drive5.com/usearch/manual/cmd_fastq_eestats.html</p><p>该提问来源于开源项目:torognes/vsearch</p></div>
  • FASTQ format

    2017-12-13 14:55:00
    FASTQ format 每个FASTQ文件中每个序列通常有四行信息: 1: 以 '@' 字符开头,后面紧接着的是序列标识符和可选字段的描述(类似FASTA title line). 2: 序列 3: 以 '+' 字符开头, 后面紧接着的是可选字段的描述性...

    FASTQ format

    每个FASTQ文件中每个序列通常有四行信息:
    1: 以 '@' 字符开头,后面紧接着的是序列标识符和可选字段的描述(类似FASTA title line).
    2: 序列
    3: 以 '+' 字符开头, 后面紧接着的是可选字段的描述性信息
    4: 第二行序列的质量信息

    Illumina sequence identifiers

    @HWUSI-EAS100R:6:73:941:1973#0/1

    sequence identifiersdescription
    HWUSI-EAS100Rthe unique instrument name
    6flowcell lane
    73tile number within the flowcell lane
    941'x'-coordinate of the cluster within the tile
    1973'y'-coordinate of the cluster within the tile
    #0index number for a multiplexed sample (0 for no indexing)
    /1the member of a pair, /1 or /2 (paired-end or mate-pair reads only)

    Versions of the Illumina pipeline since 1.4 appear to use #NNNNNN instead of #0 for the multiplex ID, where NNNNNN is the sequence of the multiplex tag.

    With Casava 1.8 the format of the '@' line has changed:

    @EAS139:136:FC706VJ:2:2104:15343:197393 1:Y:18:ATCACG

    sequence identifiersdescription
    EAS139the unique instrument name
    136the run id
    FC706VJthe flowcell id
    2flowcell lane
    2104tile number within the flowcell lane
    15343'x'-coordinate of the cluster within the tile
    197393'y'-coordinate of the cluster within the tile
    1the member of a pair, 1 or 2 (paired-end or mate-pair reads only)
    YY if the read is filtered, N otherwise
    180 when none of the control bits are on, otherwise it is an even number(偶数)
    ATCACGindex sequence

    将FASTQ 转换为 FASTA 格式:

    zcat input_file.fastq.gz | awk 'NR%4==1{printf ">%s\n", substr($0,2)}NR%4==2{print}' > output_file.fa
    
    
    #printf 命令的语法:format-string 为格式控制字符串,arguments 为参数列表。
    printf  format-string  [arguments...]
    
    
    #substr(s,p) 返回字符串s中从p开始的后缀部分
    #substr(s,p,n) 返回字符串s中从p开始长度为n的后缀部分。

    转载于:https://www.cnblogs.com/adawong/p/8032871.html

    展开全文
  • 程序sff2fastq从454基因组测序仪产生的SFF文件中提取读取的信息,并以FASTQ格式输出序列和质量得分。 用法 给定一个SFF文件file.sff您可以简单地运行: sff2fastq file.sff 如果未在命令行上指定SFF文件,则sff2...
  • qseq2fastq-开源

    2021-04-28 03:58:29
    一个将Illumina qseq文件转换为Phred fastq文件以在Maq中使用的perl脚本。 最初由UC Riverside的Tyler Bachman撰写,由Eugene Goltsman改编。 根据GNU GPLv3的条款免费提供。
  • FASTQ文件是什么?

    2021-09-13 00:01:37
  • sra是NCBI 推出的存储高通量数据的格式,下载后我们需要把sra 转成fastq,然后进行生信分析。下面分别讲一下下载和使用: 下载 下载地址:http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?cmd=show&f=...

    sra是NCBI 推出的存储高通量数据的格式,下载后我们需要把sra 转成fastq,然后进行生信分析。下面分别讲一下下载和使用:

    下载

    下载地址:http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?cmd=show&f=software&m=software&s=software
    选择适合自己的下载版本,下载后解压(解压命令:tar zxvf *.tar.gz)即可使用,转换软件(fastq-dump)位于bin文件夹下

    使用

    #single-end 单端测序

    .../bin/fastq-dump  SRR12816529.sra                 # 结果生成SRR12816529.fastq

    .../bin/fastq-dump  --gzip  SRR12816529.sra      # 结果生成SRR12816529.fastq.gz

    #pair-end  双端测序

    .../bin/fastq-dump  --split-files  SRR12816529.sra                #  结果生成   SRR12816529_1.fastq,SRR12816529_2.fastq

    .../bin/fastq-dump  --split-files  --gzip  SRR12816529.sra     #  结果生成   SRR12816529_1.fastq.gz,SRR12816529_2.fastq.gz

    展开全文
  • fastq-dump转换SRA文件到fastq文件很慢,并行版本成为趋势;无论怎么换,先要打好基础,使用并行版本的前提是要保证NCBI的fastq-dump可以在服务器上正常运行。首先安装Sratoolkit的最新版(v.2.9.2):mkdir -p/path-...

    fastq-dump转换SRA文件到fastq文件很慢,并行版本成为趋势;

    无论怎么换,先要打好基础,使用并行版本的前提是要保证NCBI的fastq-dump可以在服务器上正常运行。

    首先安装Sratoolkit的最新版(v.2.9.2):mkdir -p /path-to-Sratoolkit/ && cd /path-to-Sratoolkit/

    wget  https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-ubuntu64.tar.gz && \

    tar zxfv sratoolkit.2.9.2-ubuntu64.tar.gz&& \

    mv sratoolkit.2.9.2-ubuntu64/* . && \ rm -rf sratoolkit.2.9.2-ubuntu64.tar.gz sratoolkit.2.9.2-ubuntu64

    下载pfastq-dump:git clone https://github.com/inutano/pfastq-dump && \

    cd pfastq-dump && \

    chmod a+x bin/pfastq-dump && \

    ln -s bin/pfastq-dump  /path-to-Sratoolkit/bin

    把安装的路径加入到账号下的$PATH中:echo 'PATH=/home/luna/Desktop/Software/Sratoolkit/bin:$PATH' >> ~/.bashrc && \

    cp ~/.bashrc ~/.bash_profile && \

    source ~/.bashrc ~/.bash_profile

    使用pfastq_dump,因为pfastq_dump是基于fastq_dump写的一个bash程序,所以参数是相同的:对于单端数据转换,转换后文件是fq.gz:

    for id in *sra;    do pfastq-dump --threads 10 ./$id --gzip;    done

    对于双端数据转换,转换后文件是fq.gz:

    for id in *sra;        do pfastq-dump  --threads 8 ./$id --split-3 --gzip;    done

    直接用sra号下载并解压fastq文件,但是推荐下载好文件再使用fastq_dump转换,且文件后缀是.sra(请注意):单端数据:

    for id in SRR799545  SRR799544;    do pfastq-dump --threads 10 -s $id --gzip;    done

    双端数据:

    for id in SRR799545  SRR799544;    do pfastq-dump --threads 10 -s $id --split-3 --gzip;    done

    经过测试,其实也不是那么的快啊!!很揪心!

    展开全文
  • fastq-dump error

    2020-12-26 12:42:52
    2019-12-10T19:33:16 fastq-dump.2.8.2 err: item not found while constructing within virtual database module - the path 'SRR8232120' cannot be opened as database or table <p>What is the problem...
  • python 处理fastq文件

    2017-03-12 14:59:32
    有两个文件,一个文件sam是一列read...另外一个是一份fastq文件。 想要写一段脚本(python或者perl都可以) 。根据文件sam中的id号,从 fastq文件中提取出相应得read值(完整的read)写在另外一个新文件上
  • 生物信息数据格式:fastq格式

    万次阅读 2018-12-14 18:01:51
    文章目录格式说明实例演练判断fastq序列编码是Phred33(Illumina1.8+) or Phred64(Illumina1.3+)fastq转换fasta格式Linux 操作fastq获取数据统计reads_1.fq文件中共有多少条序列信息输出reads_1.fq文件中的标识符(即...
  • Fqzcomp是基本的fastq压缩机,主要为高性能而设计。 尽管如此,其压缩级别与bzip2相当。
  • fastq 文件的处理

    2021-08-30 23:11:50
    fastq 文件处理 fastq文件格式 @FCD056DACXX:3:1101:2163:1959#TCGCCGTG/1 TCCGATAACGCTCAACCAGAGGGCTGCCAGCTCCGATCGGCAGTTGCAACCCATTGGCCGTCTGAGCCAGCAACCCCGGA + gggiiiiiiiiiiiiiiiiiiiiiiiiiigggggeeecccccc^...
  • sra to fastq

    2020-04-16 17:23:58
    (rna) [admin@cluster sra]$ cat sratofastq #!/bin/bash #$ -cwd #$ -S /bin/bash #$ -l p=10 cd /data/admin/yyp/yypold/bio/bedtools/...~/miniconda3/envs/rna/bin/fastq-dump --gzip --split-3 -A SRR391033....
  • Fastq与Fasta格式

    2019-11-27 19:47:50
    Fastq与Fasta格式 一、关于Fastq FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。其序列以及质量信息都是使用一个ASCII字符标示,最初由Sanger开发,目的是将FASTA序列与质量数据...
  • fastq_to_bam_paired_snakemake 遵循GATK最佳做法,将成对的fastq文件转换为可分析的bams的snakemake。 该存储库包含运行snakemake所需的所有文件夹。 由于GitHub不允许空文件夹,所以results /和logs / cluster /...
  • 18 FASTQ 文件

    2020-02-21 23:48:28
    FASTQ 文件是一种存储生物序列(通常称为核酸序列)以及相应质量评价的文本格式文件。整个文件包含多条生物序列,每条生物序列由四行信息组成:第 1 行为序列标识,以‘@’开头;第 2 行是具体的生物序列(即由 A、T...
  • Fqutils提供了一套基本的生物信息学序列数据FASTQ格式与命令行工具。格雷格·汉农的优良Fastx工具包套件的补充。的是,它正确地处理FASTQ格式发布的标准,该标准明确允许多行序列和质量得分记录信息每所描述的特征之...
  • 文章目录使用Biopython读取fastq文件读取fastq文件,输出碱基序列和预测的准确度这里是具体代码的结果 使用Biopython读取fastq文件 读取fastq文件,输出碱基序列和预测的准确度 from Bio import SeqIO with open("....
  • fastq和fasta格式转化

    2021-04-18 22:21:21
    fastq >> fasta seqtk # 安装 conda install seqtk # 运行 seqtk seq -A input_file.fastq > output_file.fasta fasta >> fastq fasta_to_fastq.pl # 下载 wget ...
  • 从Python高效处理FASTQ文件
  • 超快速多线程FASTQ多路分解 介绍 使用index1或index2将单个FASTQ文件解复用为多个FASTQ文件。 该工具是用C ++开发的,支持多线程。 简单用法 # read1 and read2 are precessed separately # -o specifies the output...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,524
精华内容 1,409
关键字:

fastq