精华内容
下载资源
问答
  • 整合了许多生信相关的网课链接,包括chip-seq信息分析,GEO分析高级教程多芯片联合分析,lncRNA芯片数据挖掘,TCGA基因表达和临床性状关系,TCGA基因差异表达分析转录因子调控网络,TCGA甲基化驱动基因高级课程
  • 生信python

    2018-12-05 22:57:26
    因为这本书叫《为生物信息学设计的 Python 教程》( Python for Bioinformatics), 所以在头脑中是基于下面的假设被写出来的: 读者应该知道怎样使用计算机。不需要编程的知识,但是读者需要最低的计算机熟练 ...
  • 生信技能树

    2018-12-07 11:45:05
    生信技能树的创始人做的,有需求下载。生信技能树的创始人做的,有需求下载生信技能树的创始人做的,有需求下载
  • 生信软件 BioMercator4V4.2.3的操作说明,进行QTL定位及其遗传图谱的构建。Biomercator用于对多个QTL 分析结果进行综合的Meta 分析,帮助育种家对数量性状的多个QTL研究结果进行综合分析,便于找到的对应基因。
  • 生信质控分析-FastQC

    2019-01-13 23:25:13
    生物信息分析基础软件,高通量测序,主要用于做质控分析
  • r语言生信分析

    2019-04-22 17:06:44
    R语言生物信息分析之一 运用vegan加载包 进行Anosim analysis
  • 生信分析脚本

    2018-04-16 17:17:52
    RNA数据格式转换脚本 在linux系统上使用python进行RNA数据格式转换
  • 对于生信友好的杂志汇总,总共300多个杂志,包含接受量,影响因子等信息。
  • 生信小工具

    2018-03-16 13:37:54
    BioMercatorV4.2.jar 生信小工具
  • 本文概括了多种生信分析常用的软件及技术以及具体的用法,还包括有示例代码
  • 安馨可生信注释格式 所有变体数据 过滤 三 输出到解读表位点调整 满足以下任一一个条件就输出到sheet1: 1. 161基因上Clinvar的标签是Pathogenic或者Likely_pathogenic或者Pathogenic/Likely_pathogenic或者HGMD...
  • 生信分析例文

    2018-12-04 13:54:54
    通过生信分析挖掘在癌症中三个MiRNA,为肿瘤治疗提供靶点。
  • freebayes生信软件

    2018-01-05 15:19:14
    此软件用于calling SNP, 已经打包成zip,解压了之后可以直接用。
  • 华中科技大学生信专业课件.基因芯片的测序原理是杂交测序方法,即通过与一组已知序列的核酸探针杂交进行核酸序列测定的方法,在一块基片表面固定了序列已知的靶核苷酸的探针。当溶液中带有荧光标记的核酸序列...
  • 生信学习

    2021-02-15 09:46:53
    生信学习从哪里入手? 生信学习分道和术的学习两方面。 1、道 通过道的学习,构建生信知识体系的顶层架构。在模块化的逻辑方法指引下,参照文献案例来分辨出哪些数据分析模块再组合,怎么通过变量变化来形成套路...

    一.生信学习从哪里入手?

    生信学习分道和术的学习两方面。

    1、道

    通过的学习,构建生信知识体系的顶层架构。在模块化的逻辑方法指引下,参照文献案例来分辨出哪些数据分析模块再组合,怎么通过变量变化来形成套路化的文章。酸菜大大将生信的分析模块概括成“挑圈联靠”四个字。

    挑,是指的表达差异

    正常样本与疾病样本之间的差异,疾病不同演进阶段的差异,癌旁组织与癌组织之间的差异,不同平台技术样本来源检测方法之间的差异。表达有差异,是研究有意义的前提。通过这一步挑,可以筛选出实验组与对照组之间差异表达的基因列表。

    圈,是指的聚类分析

    聚类分析有两大作用。

    一个是对数据集样本质量的检验,就是检验所有研究的样本混在一起之后,不同分组之间的样本能否区别开,同一分组的样本能否很好聚在一起,是不是不同的数据集混在一起也能区分开不同的分组,有没把不同分组的样本标记混淆,以此来检验批间差的去除,或者数据集的样本的质量情况。

    一个是表达和功能的聚类,就是将获得的基因列表或者基因表达矩阵,把具有相似功能的基因放到一起,和生物学表型关联起来,对生物学功能/相关的通路机制进行预测分析。

    联,是指的交互网络

    交互网络有两大类。其一是化合物与分子的调控关系,可以预测药物小分子的作用靶点、耐药靶标;也可以反过来由靶标分子反向预测可能作用的药物小分子;一类是分子与分子之间的间接直接调控关系,可以预测蛋白-DNA转录因子的DNA结合位点,可以预测蛋白与蛋白之间的共表达网络、邻近基因网络、相互作用网络,可以预测RNA与RNA/DNA/蛋白的相互作用。

    靠,是指的临床意义

    临床意义包括三表一图的统计性分析,也包括构建临床预测模型的预测性分析。三表一图包括,基线资料表、单因素、多因素、生存曲线图。临床预测分析主要是对于预后、诊断、复发三方面的预测分析。

    2、术

    通过的学习,掌握生信分析的基本操作方法。生信分析包括数据库软件编程学习两部分。

    (1)学习数据库

    一个是学习如何用现有的生信可视化网站,进行预测检索或者一站式出图。常见的数据库包括GEPIA, Cbioportal, Oncomine, KM-plotter,Timer等。还有一方面是学会如何在生信分析网站上,下载基因的测序数据、临床患者资料、预测分析的结果,再用软件或者编程语言进行二次分析。常见的数据库包括GEO, TGCA, ArrayExpress, JASPAR, StarBase等。

    (2)学习软件和编程

    软件

    软件部分主要学习CytoscapeGSEA这两个软件。Cytoscape这个软件,是绘制互作网络的神器,有很多对网络进行优化的插件,比较出名的包括MCODE, cytoHubba,几乎无可替代的软件,学生信必备技能。不过只要静下心来学习实操,最多半天就可以搞定。GSEA这个软件,顾名思义,可以搞定GSEA分析,不过如果R语言编程学的够溜,用R语言也可以解决。

    编程

    编程部分有很多学习的选择,可以学习R语言,Perl, Python,JAVA, Linux等。不过对于医学生来说,学习R语言就够用了,编程语言够简单,网上教程足够多,而且有很多关于生信研究的R包可以直接用,有很多代码也是现成的,自己根据自身情况学着改一改也能分析。拿到基因的表达矩阵和临床统计结果后,用R语言妥妥可以解决。对于部分有追求而且实验室有服务器的小伙伴来说,可以再额外学一下Linux。Linux可以解决测序之后从上游原始数据进行分析的难题。自己一条龙做下来。能做到这一步的,已经是医生群体中的佼佼者了。

    (3)R语言学习要解决五方面的难题

    第一点,要了解基本的R语言的语法规则;

    第二点,学会用R语言进行可视化作图;

    第三点,学会用R语言进行统计分析;

    第四点,学会用R语言进行数据清洗;

    第五点,学会用R语言解决生信中的具体问题,比如免疫浸润的相关分析,基因组中常见的TMB该怎么计算等。

    术的学习可以参考解螺旋生信体系课上下篇,上篇专注于解决数据库和软件学习的难题;下篇专注于教授应用R语言进行常见的生信分析。另外精品课里还配了《R语言基础:高效数据清洗》和《SCI论文绘图之道》两门课分别为大家的R语言数据清洗和可视化绘图的功底打基础。

    R语言的学习推荐两本书,《R数据科学》和《R语言实战》。对着书一页页看下来,跟着实操敲代码,了解R语言的基本语法、常用R包,写笔记进行总结,往复2-3遍下来,基本上就能把R语言掌握的差不多了。如果觉得这样一步麻烦,也可以直接参考解螺旋的R语言教程,大大缩短了R语言学习时间。

    二.如何选择最有效的生信学习的路径呢?

    任何的学习路径都有其相似之处,都是遵循了解-学习-模仿-交流-创新五步走。

    第一步:了解生信和指定计划

    可以通过关注一些生信公号,阅读生信相关文字和视频教程,在脑海中对生信有一个初步的印象。了解生信是什么,怎么用,如何用,哪些对我有用,我想学习哪些生信技能,预计多长时间。

    第二步:大量输入学习生信

    可以通过阅读生信相关的文献,了解生信的基本分析套路和宏观逻辑框架,学习解螺旋相关的生信文章复现的文字和视频教程,再按图索骥,根据文章内容学习自己不会的生信分析。

    第三步:复现分析

    根据已有的教程,按照从易到难,对生信文章进行复现分析,不求完整复现,但求能一步步按正确的方法操作下来。谁又知道是不是原文作者的操作失误,或者数据库更新改版呢?总之,没有必要追求完全一致,如果你不是为了给死对头原文作者打假的话。如果抱着学习的目的,学习分析技巧为先。

    第四步:交流修正

    操作过程中肯定遇到很多bug或者自己不理解的地方。这时候就要发挥网络平台和社群的力量了。有遇到的报错或者难题都可以去百度进行搜索,如果百度搜索不出来,换个浏览器也可以。搜索页的前五页,一般总能找到你需要的答案。而且解螺旋为所有购买过生信体系课的小伙伴都建立了琼林书院,有助教长期为大家答疑。总能找到问题的解决方案。

    第五步:创新

    根据最新的研究热点,根据现有的模块逻辑和科研热点,进行新的迁移应用分析。比如最近的新冠疫情,不同场景的再应用,也催生了不少相关的生信文章。还有多组学分析、泛癌分析、m6A甲基化分析、可变剪切、SNP分析等等。都可以再堆叠嵌套地分析,只要言之成理,自己圆成一个完整的故事即可。

    如果你严格按照这几步执行,相信不出几个月,肯定生信会有所小成!

    展开全文
  • 生信学习书籍

    2018-08-14 11:36:42
    Bioinstrumentations involves biological variable measurements, this assists the physicians in treatment and diagnosis of their patients (Khandpur, 2004). In order to operate the equipment, electronics...
  • 接上两篇内容,本文主要讲述工作中NGS从科研进入医学临床领域,工作中接触到生信流程,以及最终在自动图形化开放式生信分析系统开发中生信workflow设计实现的过程。 接触二代测序,生信分析,那真是打开了一个新...

    接上两篇内容,本文主要讲述工作中NGS从科研进入医学临床领域,工作中接触到生信流程,以及最终在自动图形化开放式生信分析系统开发中生信workflow设计实现的过程。

    接触二代测序,生信分析,那真是打开了一个新世界的大门,各种名次术语满天飞,搞的头晕脑胀。什么“什么是高通量测序/NGS”、Sanger法测序(一代测序)、外显子测序(whole exon sequencing)、mRNA测序 (RNA-seq)、SNP/SNV(单核苷酸位点变异)、
    INDEL (基因组小片段插入)、copy number variation (CNV)基因组拷贝数变异、structure variation (SV)基因组结构变异等等。

    百度了各种相关的分析软件和文件格式,什么fastq,fastq,bam,vcf等等。下面分阶段描述生信分析流程升级/进化的过程:

    软件获取:到官网sliverworkspace.com免费下载个人版,最新版本 2.0.277363

    1.手动命令行运行

    经过几个月接触,自学、爬坑,慢慢搞清楚了部分内容,在似懂非懂之间开始了生信流程分析,终于有一天明白过来,这所谓的pipeline其实就是基于文件的工作流啊。
    比如其中一个步骤:
    fastqc

    QC 完成后,然后运行下一个步骤:
    mapping to reference

    运行模式,一个输入或者多个输入文件,通过软件分析/计算得到一个或者多个输出文件。
    然后输出文件部分或者全部作为下一个步骤的输入文件。这时候手动分析的话,只能手动的一个一个输入命令,完成每一个步骤,直到得到最后结果。

    如下面代码:
    bwa mem -t 8 -M -R \ 
      "@RG\tID:0bdd6f55\tLB:5fba\tPL:Illumina\tPU:3102\tSM: B1701" \
      B1701_R1.fq.gz B1701_R2.fq.gz | samtools view -bS - > B1701.bam
    
    gatk ReorderSam \ 
      -R /opt/ref/hg19.fa \ 
      -I B1701.bam \ 
      -O B1701_reordered.bam
    
    gatk SortSam \ 
      -I B1701_reordered.bam \ 
      -O B1701_sorted.bam \ 
      -SO coordinate
    
    

    2. 脚本连续运行

    随着熟练程度提高,生信分析上用到的软件/工具也熟悉起来了,但是问题也暴露出来了,
    简单的一套 GATK Best Practice 肿瘤突变分析流程,加上CNVSV 分析从 fastq 文件开始到最后得到过滤的 vcf 结果,一共有 30 多个步骤。自己一条一条输入次数多了就开始烦躁了。

    这时候自然会考虑,如何减少手动输入,将这些脚本自动化。

    脚本自动运行:当然这需要一点编程基础了。其实总的来看,每一个步骤的输入和输出可
    以根据最开始的输入文件来判断。
    例如 B1701_R1.fastq.gz,bwa map 之后得到B1701_R1.bam,所以只需要获得最初的文件前缀,作为 SampleNumber 字段,后续的中间输出,最终的输出文件都以这个 SampleNumber 为前缀,以扩展名作为区分。这时候脚本就可以连续运行了。
    以 shell 为例:总的脚本运行:

    workrun.sh B1701_R1.fastq.gz B1701_R2.fastq.gz

    脚本的第一步,就是获取输入文件:B1701_R1.fastq.gz B1701_R2.fastq.gz经过匹配计算,可以得到 B1701 作为 SampleNumber,并保存在变量$SN中。后续的输出都以$SN.bam $SN_sortted.bam $SN_marked.bam等等,这样后续的步骤可以作为一个列表来表示:

    export SN=1701
    
    bwa mem -t 8 -M -R \ 
      "@RG\tID:0bdd6f55\tLB:5fba\tPL:Illumina\tPU:3102\tSM:$SN" \
      $SN_R1.fq.gz $SN_R2.fq.gz | samtools view -bS - >$SN.bam
    
    gatk ReorderSam \ 
      -R /opt/ref/hg19.fa \ 
      -I /opt/result/$SN.bam \ 
      -O $SN_reordered.bam
    
    gatk SortSam \ 
      -I $SN_reordered.bam \ 
      -O $SN_sorted.bam \ 
      -SO coordinate
    

    运行脚本之前使用 B1701 替换变量$SN 得到要运行的真实的 shell 命令

    bwa mem -t 8 -M -R \ 
      "@RG\tID:0bdd6f55\tLB:5fba\tPL:Illumina\tPU:3102\tSM: B1701" \
      B1701_R1.fq.gz B1701_R2.fq.gz | samtools view -bS - > B1701.bam
    
    gatk ReorderSam \ 
      -R /opt/ref/hg19.fa \ 
      -I B1701.bam \ 
      -O B1701_reordered.bam
    
    gatk SortSam \ 
      -I B1701_reordered.bam \ 
      -O B1701_sorted.bam \ 
      -SO coordinate
    
    继续完善:
    • 如何判断这一步是否真正完成了,运行过程有没有错误。如果有错误,停止后续步骤运行:这里首先想到的是,运行结束后,判断预期的输出文件是否存在,文件大小是否大于 0,有些软件即使运行错误也会创建一个大小为 0 的文件。
    • 比如计算这一步骤运行需要多少时间。在命令行 shell 前面加上 time
    time gatk SortSam \ 
      -I B1701_reordered.bam \ 
      -O B1701_sorted.bam \ 
      -SO coordinate
    

    3.一个脚本 shell 文件运行整个分析流程

    上面的内容解决了 shell 脚本连续运行的问题,但是还有一些遗留问题可以改进:

    • 输入文件如果指定一个目录是否更好一些? 如: $data
    • 输出文件如果指定一个目录是否更好一些? 如: $result
    • 运行的软件/工具/脚本路径使用变量替代,这样便于升级维护,升级时候只需要修改
      该变量的值就可以了。如:$bwa $samtools $gatk
    • 运行过程中引用的 reference 文件,数据库文件的路径也用变量替代,升级版本的时
      候只需要修改变量的路径就可以了,这样便于升级维护 如 $hg19 (hg19.fa)
    • 运行中的重要参数,一些 cutoff 值,配置的运行资源 如: $threads

    这样经过以上替换,前面的 shell 脚本就替换为:

    export SN=B1701
    export data=/opt/data
    export result=/opt/result
    export bwa=/opt/tools/bwa
    export samtools=/opt/tools/samtools
    export bwa=/opt/tools/gatk
    export hg19=/opt/ref/hg19.fa
    export threads=8
    
    time $bwa mem -t $threads -M -R \ 
      "@RG\tID:0bdd6f55\tLB:5fba\tPL:Illumina\tPU:3102\tSM:$SN" \
      $data/$SN_R1.fq.gz $data/$SN_R2.fq.gz \
      | $samtools view -bS - >$result/$SN.bam
    
    time $gatk ReorderSam \ 
      -R $hg19 \ 
      -I $result/$SN.bam \ 
      -O $result/$SN_reordered.bam
    
    time $gatk SortSam \ 
      -I $result/$SN_reordered.bam \ 
      -O $result/$SN_sorted.bam \ 
      -SO coordinate
    

    这时候已经将整套流程简单精简为一个 shell 脚本,如命名为 workrun.sh,每次运行整套
    流程之前,将变量$SN 的值修改为需要的值就可以了。如果要升级软件、升级 reference 文件
    版本,修改 shell 脚本相应变量值即可。

    到这里就结束了么?还能继续改进么?请继续往下看。

    4. 自动扫描文件并运行脚本

    前面我们通过变量定义两个目录$data$result分别来表示,分析流程的输入文件目录$data和分析输出文件目录$result,这时候如果我们写一个脚本,按照一定周期判断$data目录下是否有符合要求的文件,如果有文件符合要求,就运行前面的 workrun.sh启动分析流程。
    待整个分析流程结束后,将$SN对应的 SampleNumber 值写入一个文件,下次扫描判断文件对应的 SampleNumber是否已经分析过。

    ##5. 带报告的自动扫描并触发运行脚本
    前面已经实现了自动扫描并分析文件,这时候我们需要将保存$SN的文件完善一下,在分析之前录入样本信息,具体样本信息的记录和操作。

    参照文章:自动化图形生物信息分析系统开发-2 样本信息处理

    运行分析之前,用 SampleReport字段表示分析状态,扫描脚本根据 SampleReport字段是否为空判断,该样本编号 SampleNumber对应的文件是否已经分析过。分析开始后,更新SampleReport字段为当前日期,分析完成后,再更新为分析完成时的日期。

    分析报告,首先我们准备一个分析报告模板,将需要填充的字段,用变量的形式表示,如
    ${sn}${sampleReport}等等,包括

    • 样本信息
    • 患者信息
    • 分析结果
    • 用药信息
    • 引用文章链接
    • 审核签名 等等

    等分析结束后,从样本保存文件,和分析流程最终输出文件中获取数据并填充,得到整个分析报告。像这些数据处理过程,使用 shell就有些吃力了,我这里使用 python改写了上面的脚本,并实现了对数据处理,报告填充功能。

    到这里,基本上就达到绝大多数公司的生信自动化分析水平了

    6. 然而到这里就足够了么?

    这里讲的生信的应用领域是医学临床领域,然而上述水平到这里最多也就是“工具”、“脚本”的水平,真要应用于临床,作为一个 “医疗产品”来要求,还有相当远的的距离。毕竟医学是严肃的事情,直接影响到人的健康和生命,希望各位生信大佬理解。

    从“软件工程”的角度,上述内容也远远达不到一个软件产品的标准:

    • 首先这些脚本都是生信开发人员编写的,绝大多数没有测试,从单元测试、集成测
      试、功能测试、压力测试、稳定性测试都没有,一旦,项目复杂度上升,这些脚本/
      工具的代码质量堪忧,很多公司都是一边运行一边调试。
    • 其次基于命令行脚本的运行环境,没有友好的交互界面,对于使用者要求过高,难以普及大范围推广。对于使用者的要求基本上就是一个生信开发人员的要求:熟悉Linux 操作系统,熟悉各种常用分析软件和工具,能够从脚本错误输出中判断出原因并调试解决。

    以上缺陷也是笔者开发“自动图形化生物信息分析系统”的初衷,后续内容生信流程的图形化实现请继续关注本系列文章。

    您可以下载PPT或加QQ群:853718264讨论

    展开全文
  • 生信基础知识 有了生信分析平台,如何灵活运用还是要学点独门绝学的。21世纪最重要的是人才,人才最好掌握三门语言,将让你人生立于不败之地,在任何团队中都是不可或缺的人才。这三门语言就是中文、英文和计算机...

    转录组分析是目前应用最广的高通量测序分析技术之一。常见设计是不同样品之间比较,寻找差异基因、标志基因、协同变化基因、差异剪接和新转录本,并进行结果可视化功能注释网络分析等。

    转录组的测序分析也相对成熟,从RNA提取、构建文库、上机测序再到结果解析既可以自己完成,又可以在专业公司进行。

    概括来看转录组的分析流程比较简单,序列比对-转录本拼接 (可选)-表达定量-差异基因-功能富集-定制分析。整个环节清晰流畅,可以作为最开始接触高通量测序学习最合适的技术之一。

    但重点和难点在于理解这些过程都是怎么做的,有什么需要注意的,结果怎么解读,后续分析怎么做。这些只有自己动手操作过,才可能有理解。而理解了一个,再去做其它类型分析,也会轻松很多。

    实验设计这块重要的是对照和至少3个生物学重复,并选择合适的测序通量。ENCODE要求重复之间的Spearman correlation值大于0.9 (遗传背景不一致的生物重复相关系数要大于0.8)。定量基因表达和评估转录图谱相似性只需要中等测序深度;而研究新转录本和可变剪接则需要更深的测序;一般来讲长RNA-seq文库测序深度满足可用reads20-30 million (如果测PE150,换算成碱基数为6G-9G)。

    另外一个需要注意的是测序的批次效应,保证自己的样品同时处理、RNA同时提取、同时构建文库和上机测序。这些环节虽然不能总受我们控制,但记录下对应的操作时间和批次,最后在绘制表达图谱时与实验相关参数进行关联展示 (利用我们介绍的热图简化高颜值免费在线绘图工具升级版来了~~~),从而保证结果没有受到试验中处理批次的影响。ENCODE计划有一篇文章在比较人和小鼠不同组织的表达谱相似度时得到的结果是样品按物种而非组织聚在一起,这与之前认为的发育通路的保守性不符。后来发现是测序批次捣的鬼,做了批次效应矫正后,表达图谱按组织而非物种聚在一起了(高通量数据中批次效应的鉴定和处理 - 系列总结和更新)。

    测序环节通常不需要自己操作,测序公司都很成熟,但测序的原理需要知道。这会影响到后续分析时参数的选择,比如知道什么是插入片段大小什么是链特异性测序,什么情况会有接头序列,双端测序如何测等。

    获得数据后,就涉及到数据的传输和质量评估(也包括如何从公共数据库下载数据)和文件格式的转换。FASTQ格式解释和质量评估中有些提及。质量评估的意义在于从测序质量角度评价建库和测序的成功与否,指导接头和低质量碱基的去除。这一步参数控制的严格与否对后续的比对会有影响,同时也会受到后续分析选择的工具的影响。对Linux系统一定程度的了解,是进行这些工作的基础。

    39个转录组分析工具,120种组合评估(转录组分析工具哪家强)中讲述了如何选择、评估合适的比对工具,序列拼装工具,定量工具和差异分析工具。值得我们在进入正式的分析之前,仔细阅读。另外类似的评估文章,还有几篇,都可以一并读一下,这样在后期分析时对工具的选择和使用才更得心应手。

    工具比较类文章一般只告诉你做了什么,不告诉你这么做的原因是什么,而且每一步细分开来又有很多小细节需要注意,比如在比对环节就会涉及到:不同的样本如何选择合适的基因组和注释文件,什么样的软件支持Junction reads的比对,什么样的比对率是合适的,比对质量怎样,测序中RNA有无降解或选择偏好性,测序饱和度如何等。

    这些可能都不会体现在最终的结果中,但都是确保后期结果可靠性所必须要做的事情。2002年诺贝尔奖得主Sydney Brenner曾对数据分析做过提醒Garbage in, Garbage out。软件是死的,提供了格式正确的输入,就可以得到输出,但输出正确与否,就得靠人的经验来判断了。

    在后面的差异基因鉴定阶段,还存在把FPKM值转换为整数再提交给DESeq2做分析的,软件不报错,但结果不对。或者能顺着教程运行DEseq2分析,但换成自己的数据就不知道如何下手的 (DESeq2差异基因分析和批次效应移除)。这些问题都需要在实践过程中持续不断的试错、阅读更多的文章和教程来步步矫正。

    做下测试题看看了解多少?

    1. 120分的转录组试题(第一份答案)

    2. 120分的转录组试题(第二份答案)

    3. 120分的转录组试题(第三份答案)

    这当然是一个耗时耗力的过程,那么有没有一个更好的方式呢?

    那就是第十五高级转录组分析和R数据可视化

    (部分视频可在B站空间免费查看:https://www.bilibili.com/video/BV1rD4y1272a)

    基于以往14次转录组培训,转录组课程内容成熟,可以在最短的时间学会最多的知识。

    之前的培训重点都在前面的流程分析,这次做了调整,流程分析整理一个清晰的输入、输出框架,包装好的流程脚本和参数注意,快速实战操作从源头。重点调整到后续的定制分析和绘图,涉及常见GO分析、单细胞转录组的聚类分析、配对样品和时间序列样品的GSEA富集分析、结合motif预测和转录因子ChIP的调控网络分析、定制化图形绘制、Cytoscape进行富集分析、调控网络、通路的可视化,目标基因筛选和可视化, WGCNA加权共表达网络分析,机器学习,ceRNA网络。

    每部分都提供清晰的思维导图方便理解输入、输出、命令、参数和注意事项。

    后续在我们的培训群也会提供长期的免费图形绘制合作服务,跟大家分享绘图代码,一起学习。

    十五高级转录组分析和R数据可视化于2021年10月29日在线开班,将系统讲述基于和不基于比对的转录组分析流程,从原始数据到表达矩阵、差异基因、可变剪接、富集分析、加权共表达网络、通路分析、可视化绘图,ceRNA,机器学习等一系列常见操作,理论和实践兼备。

    (最近报名网站升级,可能还有些问题)

    课程大纲

    请详细阅读课程简介,如果以下内容您全精通,不必参加此培训。

    每节课1小时一个主题,理论结合实战,学懂原理,实战实操,全是老司机多年经验、流程和代码的无私分享,手把手带您快速入门、节约宝贵的时间,助力科研成果早日产出。

    下面是课程安排,本课程一共3天,每天6节课,共18节课,全部课程均理论与实战结合(只要课上讲的都是可以学会并自己实现的分析)。如11代表第一天第一节课,26代表第二天第六节课,41为两周后的不定期线上集中视频答疑和后续的讨论群永久答疑。

    该课程为第13期,经过12次迭代更新,整个过程都比较成熟,可以在最短时间学习最多知识。3天时间,老司机带您完成自学需要3个月甚至是1年的崎岖之路,助力您真正玩转转录组分析,并根据自己课题的背景优化分析方案。

    编号内容简介
    01视频学习Linux基础预付后提供学习视频
    02视频学习R基础预付后提供学习视频
    03软件安装预付后提供安装视频
    04支付全款提供全部视频用作预习
    11转录组概述转录组设计、应用、批次效应
    12转录组分析流程简介基于/不基于比对的分析流程讲演
    13Salmon定量实战不基于比对直接定量基因和转录本的表达
    14差异基因分析DESeq2多组差异基因分析、热图、火山图
    15GO富集分析和可视化泡泡图、热图、网络图、弦图
    16GSEA富集分析和可视化分组和时间序列GSEA
    21二代三代测序原理介绍建库测序过程及注意事项
    22原始数据比对回基因组STAR比对和定量
    23基于count的差异基因批次效应鉴定和移除
    24Linux下转录组环境配置Conda软件安装、配置
    25基因组浏览器数据可视化IGV呈现reeads比对、峰图、Sashimiplot
    26转录本拼装StringTie可变剪接分析rMATS
    31文章常见图表绘制和解读Illustrator制作CNS标准图版
    32WGCNA基因加权共表达网络分析和性状关联
    33非编码lncRNA鉴定ceRNA分析 (miRNA-lncRNA-gene调控)
    34无参转录组分析Trinity组装 eggnog注释
    35转录调控分析转录调控网络
    36Marker基因鉴定PCA随机森林
    41答疑-线上答疑、考试内容串讲

    教程内容简介如下:

    转录组分析平台搭建

    服务器平台:没有软件的计算机只是一堆废铁,没有转录组分析系统的服务器也和你的数据分析没有半毛钱关系。想要搭建整套的转录组分析流程,网上的资源即零散、又稀少。易生信团队将分享多年经验摸索优秀软件和布置技巧,并分享全部源代码,让你在主流Linux服务器系统(Ubuntu 16/18.04,CentOS7等主流发行版)上快速布置专注组分析流程依赖的几十款常用软件、几百个依赖的R和Python包,轻松拥有专业分析平台。

    个人计算机平台:高通量测序所谓的大数据,都是在原始数据和分析过程中体量大,计算资源需求多,但结果文件不大。通常转录组分析会获得样品基因表达表、新转录本和非编码基因,这些表格是下游分析、高级分析以及个性分析的起点,绝大部分工作在我们的笔记本上是可以搞定的,只是很多人并不知道如何入手。

    其实你的个人电脑就是数据表(丰度矩阵)统计分析的利器。易生信团队独创实现了跨平台的分析流程,在大家的Windows笔记本上可以轻松实现转录组统计、可视化的绝大多数分析,课程带你轻松在自己的本本上搭建数据表统计分析与可视化平台,基于目前最主流的Win10进行优化和测试,让笔记本秒变数据分析可视化平台。

    生信基础知识

    有了生信分析平台,如何灵活运用还是要学点独门绝学的。21世纪最重要的是人才,人才最好掌握三门语言,将让你人生立于不败之地,在任何团队中都是不可或缺的人才。这三门语言就是中文、英文和计算机语言。中文每天都在用在学,英文对于博士也至少接触了10年以上并能应用于阅读和写作文献,而编程语言大家大学阶段都学过Visual Basic、Visual Foxpro、或C语言,但能在工作中应用的绝对凤毛麟角。更何况这些语言在生命科学领域是非常低效的,不提倡学习。

    生信中最常用的三类语言是·Shell + R + Python/Perl·,前两门是基础,生物学家必要掌握的ShellR语言基础知识,保证你完成项目分析。我们在课上将同时讲解生物学家必要掌握的Shell和R语言基础知识,保证你高效、稳定的使用转录组分析平台、保证大数据分析和后期可视化至发表阶段所需的技能。我们在文后提供了学习视频供提前预习。

    当你利用几个小时,走进大数据分析和可视化的大门后,你将发现一个全新的世界。很多人会感觉相见恨晚,爱上分析,从此走向人生的快车道。即使你对编程不感兴趣,这里面用到的理念也定能让你受益终身,在今后相关分析中事半功倍,比别人更胜一筹。再说现在连小学生都学Python了,再不会,孩子都带不好了。

    (如果基础薄弱,报名付款成功后,可免费领取基础程序课,做好准备工作, 让程序成为我们的得力工具而不是学习新知识的绊脚石。)

    图表解读和绘制专题

    针对很多老师缺少系统的生信背景,看不懂分析文章图表,更对绘制各式图表手足无措的情况,在培训时,我们将结合发表的高水平文章,进一步讲解16种常用分析图的原理和使用范围,让你不仅读懂图,更知道如何应用于自己的研究,并亲自轻松完成绘图。

    针对大家使用R语言绘图学习时间成本较高的问题,易生信团队针对常用16种图开发了免费绘图网站,一键出图,更可鼠标点选参数修改图形的个性样式。

    成果发表是科研过程中不可缺的一部分,发表成果又少不了图形展示。文章图表排版是否整齐规范、协调一致、重点突出对一篇文章的发表也是有不少贡献的。之前推出的文章发表图的修改和排版讲演了部分图形编辑和排版操作,本次培训也会实践从原始图形、到细节修饰再到排版发表的整个过程和注意事项。


    转录组高级分析

    1. WGCNA基因共表达分析,WGCNA基因、表型关联分析

    2. Cytoscape绘制ceRNA、转录调控、蛋白蛋白互作网络

    3. Cytoscape 共表达网络绘制

    4. KEGG/Reactome通路图表达映射

    5. 基因互作的文献挖掘和数据库挖掘展示

    6. GO/GSEA(普通分组、数量形状和时间序列)的定制分析

    转录组的应用、设计和案例分享

    转录组是很常规的分析,也是入门高通量测序分析的基础。这部分涵盖整个高通量测序技术的应用,高通量测序技术的实验原则包括测序通量测序批次测序原理等。

    1. 转录组学研究技术介绍

    2. 转录组学实验设计和测序原则、注意事项

    3. 二代、三代测序过程和原理解析

    4. 转录组学文章案例分析

    5. 在线基因表达资源数据库

    转录组分析流程实战

    1. 转录组分析流程评估

    2. 测序数据质量评估和清洗

    3. 不基于比对的差异基因分析

    4. 基于比对的差异基因分析

    5. 转录本组装、选择性剪接分析和非编码RNA鉴定

    6. 目标基因GSEA/GO富集分析

    学习完本课程,你能得到什么?

    1. 深彻理解生物测序数据的基本思想和分析流程

    2. 高级转录组分析和可视化的全套流程

    3. 应用于各个领域的分析经验、代码和发表级别的结果可视化

    往期精彩回顾

    学员主要来自中国大陆各高校和研究所的院长、教授、副教授、研究所和本科生,也有来自茅台、五粮液、安琪酵母、华为等大厂的科研人员,甚至有海外华人不远万里从美国、欧洲、澳州、新西兰、新加坡等地飞来北京参加专题学习研讨会。

    主讲教师

    陈同,博士,2015毕业于中科院遗传与发育生物学研究所,生物信息专业博士,在Cell Stem Cell(IF=23.2,第一作者兼封面文章),Nucleic Acids Research X 3,Protein& Cell, Stem Cells and Development等高水平杂志以第一作者或主要作者发表文章,运营有十万人关注的《生信宝典》微信公众号,给你不一样的学习生信体验。

    授课模式

    线上线下同步开课,线上采用腾讯会议直播。整个过程都会录屏,视频可无限期观看,供后续反复观看学习。

    本课程以讲解流程和实际操作为主,采用独创四段式教学,封装好的代码全部分享,随处可用:

    • 第一阶段 3天集中授课;

    • 第二阶段 自行练习2周;

    • 第三阶段 在线直播答疑;

    • 第四阶段 培训视频继续学习;

    • 实现教-练-答-用四个环节的统一协调。

    培训时间

    每天早9点到晚5点

    授课地点

    北京市西城区鼓楼附近(鼓楼地铁站周边1公里)。

    线上线下同步开课,线上采用腾讯会议直播。整个过程都会录屏,视频可无限期观看,供后续反复观看学习。

    课程价格

    1. 开课两周前报名 4500 元/人

    2. 名额有限,每次课程报名满40人后自动关闭报名通道

    3. 提供易汉博基因科技实习机会或工作机会

    课程福利

    1. 线下座位按报名并缴费或预付款成功顺序从前到后龙摆尾式排序 (线上直播不排座位)

    2. 赠送对应课程往期视频课一份 (http://bioinfo.ke.qq.com)

    3. 多人 (N,10>N>1) 组团报名并同时缴费,每人还可减免N-1百元 (最高500)

    4. 线下课程赠送金士顿U盘一个(32G含培训数据和脚本);

      线上的培训数据和脚本通过QQ群文件共享,内容与线下的U盘完全一致

    5. 附推荐语分享对应的招生信息到朋友圈,截图发到train@ehbio.com 可获得200元生信宝典腾讯课堂课程优惠券(可拆分供多个课程使用)

    6. 易生信同时推出多门相关课程,连报优惠——同时选2门课,95折;

      三门课9折,4门及以上85折。

      还可与团购同时优惠!

      扩增子(项目初探)+宏基因组(高精尖),祝你分析水平更上一层楼。

    注意事项 *

    1. 需自备笔记本电脑,推荐使用win10系统,4G以上内存(推荐8G)。

    2. 培训班所有数据,文档为内部资料,仅供参阅,未经允许不得翻印外传登刊

    3. 上课期间禁止录音,录像

    4. 成功付款的学员,若临时有紧急事情不能到来的,可申请延期,更换后续培训班;

      也可申请退款

    5. 若开课2周 (含) 前申请退款可退还85%费用;

      开课3个工作日 (含) 前申请退款退还70%的费用 (若已开发票需承担相应手续费)

    6. 不可先延期再退款

    更多课程的详细介绍,请扫描下方二维码。

    易生信同时推出多门相关课程,连报优惠——同时选2门课,95折;三门课9折,4门及以上85折。还可与团购同时优惠!扩增子(项目初探)+宏基因组(高精尖),祝你分析水平更上一层楼。

    复制以下链接http://www.ehbio.com/Training/ 或 点击阅读原文跳转报名页,成为实验中不可或缺的人,赶快报名吧!

     

    (有问题扫码咨询;因课程联系人数较多,若回复不及时请耐心等待;大部分一文也都可在培训网站或报名回复邮件中查询到)

    展开全文
  • 生信期刊推荐

    千次阅读 2021-01-13 15:37:21
    总的来说,BMC Bioinformatics是一本发文量多、命中率高、审稿速度在34个月,值得23分的生信文章首选投稿的期刊 9、OMICS-A JOURNAL OF INTEGRATIVE BIOLOGY 2.529 中科院分区 大类:生物 3区 小类:遗传学 4区|...

    1、 IEEE-ACM Transactions on Computational Biology and Bioinformatics 3.015
    中科院分区表3区,CCF B类期刊
    审稿速度:4.0
    经验分享:现在是ccf-b类期刊了。 期刊的高难度与其低影响因子成反比,,感觉好难中。
    审稿速度:6.0
    经验分享:交叉学科的刊,基于深度学习方面还是挺好发的。

    2、 Bioinformatics 5.610
    BIOINFORMATICS杂志属于生物行业,“计算机:跨学科应用”子行业的顶级杂志。 投稿难度评价:虽然影响因子不是很高,但是也是行业的知名杂志,要求很高,投稿不太容易。
    中科院分区表3区

    3、 Computational and Mathematical Methods in Medicine 1.770
    中科院分区表4区
    平均审稿速度:网友分享经验:一般,3-6周
    平均录用比例:网友分享经验:容易

    4、mSystems 6.633
    中科院分区
    大类:生物 2区
    小类:微生物学 2区
    经验分享:2次小修后accept,审稿人意见一般,死扣细节,感觉有点水
    审稿速度超慢,大约2个月,非常耽误事
    经验分享:要求较高,要求数据量大,能充分支撑结论。
    投稿经验:
    1,生信文章已发表。
    2,到editor手上很快 就是reviewer审稿较慢,第一次审稿三个月后被拒了,但是我们的数据较大所以editor修稿后可以重投,给我们留了重投的渠道。
    3,于是修改后又重投,每次审稿周期都在两个月左右,前后一共返了四次。
    第一次投稿到发表,一共经历了一年又2个多月,周期有点长。
    4,一共找了两个reviewer一个偏向技术 一个偏向科学问题,还是挺专业的。
    5,但好在这个杂志的影响因子一直在上升,口碑也很好,所以整体来说,质量还是可以。
    如果赶时间发表不建议投该杂志。

    5、 BRIEFINGS IN BIOINFORMATICS 8.990
    在JCR分区和中科院分区都是一区期刊。18年文章量仅120篇,以双月刊的形式出版。审稿周期约2个月,版面费收取3308美金。接受率约25%,国人发文占比高达28%。
    对研究的原创性和创新性有较高要求,学术水平较高,发文有较高难度。也因此,浏览和参考其严谨的研究方法和文献等,
    平均审稿速度:网友分享经验:平均6月
    平均录用比例:网友分享经验:较难

    6、 Frontiers in Microbiology 4.236
    中科院分区
    大类:生物 2区
    小类:微生物学 2区
    审稿速度:1.0|投稿命中率:25.0|版面费用:2950.0
    经验分享:肠道微生物方向,做实验带写文章快折腾了2年。10月份,一开始投mbio被拒了,11月中旬改投的FM. 差不多一个月时间拿到三个审稿人的意见,除了其中一个意见有二十多条,其他两个人都是提了四五十条以上的修改意见,万幸没有让补充试验。目前还在焦急等待中。
    之前听朋友说FM很好投,而且看了一些前几年的文章感觉有的确实很一般。不过现在看也没那么容易。希望杂志努努力明年也能进到1区吧。
    审稿速度:3.0
    经验分享:投稿综述大的修改后已被接收,感觉很专业。
    最近学校提出这个杂志被警示了,不知其它学校有无这种情况,感觉不应该啊,if也在增加,今年预计4.40-4.50

    7、 PLoS Computational Biology 4.428
    中科院分区
    大类:生物 2区
    小类:生化研究方法 2区|数学与计算生物学 1区
    PLOS COMPUT BIOL 在该细分领域可能是国际一流杂志,但是国内关注少,可能与很难投中有关吧,可以试试,但不要报过高中的期望哦。
    目前计算生物学领域认可度较高的期刊,第一次投稿被编辑秒退,第二次投稿修改一次后被录用了。期刊对论文内容、方法、表述要求相当高,每年发表论文数目比较稳定,国内论文比较少。每年的影响因子不是很高,比较稳定
    计算系统生物学领域的顶级期刊,比较小众,但在学术同行的认可度和含金量很高。
    数学与计算生物学领域最受认可的杂志。更bioinformatics在风格上稍有不同,更强调生物学意义。中国学者(包括合作署名)在pcb上发表论文的比例不足5%. 而bioinformatics为15%以上。可见在pcb上发表论文的难度。
    作为中科院二区的期刊,看重文章新颖性。该期刊接收率50%,自引率5.7%,版面费2350美元,国人发文占比4%,年文章量600+,相关研究方向的粉丝可以尝试投稿。综合该期刊,投稿命中率高达50%,影响因子稳定。

    8、 BMC BIOINFORMATICS 3.242
    中科院分区
    大类:生物 3区
    小类:生物工程与应用微生物 3区|生化研究方法 3区|数学与计算生物学 2区
    与相似领域的其他的期刊相比,BMC Bioinformatics的命中率达55%,且审稿周期也较短,一般4周左右就能返回,
    2020.4.26 投递
    2020.5.31 一审意见下来
    2020.6.12 一审修改后投递
    2020.7.23 录用
    每次投文章都是几经周折,这篇文章在2019年8月份就开始投递了,只不过被拒了,编辑说修改后可以重新投递。之前投的时间如下:
    2019.8.25 投递
    2019.11.15 直接被拒
    然后花了大半年修改后又重新投。关注生信算法可看审稿意见,谢谢。
    总的来说,BMC Bioinformatics是一本发文量多、命中率高、审稿速度在34个月,值得23分的生信文章首选投稿的期刊

    9、OMICS-A JOURNAL OF INTEGRATIVE BIOLOGY 2.529
    中科院分区
    大类:生物 3区
    小类:遗传学 4区|生物工程与应用微生物 3区

    10、GENOMICS 6.205
    在中科院分区中,Genomics期刊属于生物学大类3区,生物工程与应用微生物小类3区,遗传学小类3区;
    在审稿速度方面,Genomics期刊表现相当优异。根据期刊官网显示,该刊对过去几年论文发表的速度进行了统计,平均8周左右就能接收,最快几天就能完成投稿。

    11、Scientific Reports 3,998
    中科院SCI期刊分区
    ( 2020年12月最新升级版)
    大类学科 小类学科 Top期刊 综述期刊
    综合性期刊3区
    MULTIDISCIPLINARY SCIENCES
    综合性期刊 3区
    是机器学习和癌症检查的结合。估计是editor在网上看我发过类似的方向,找的我吧,之前没联系过。
    这篇论文可以说完全没有创新性,就是用sklearn里面的模型在癌症数据库上跑了下,调调参,类似的论文都烂大街了。工作量不能说没有,但整体都是苦活,至少从机器学习这个方向来说是没有任何贡献的。如果要修改,也就是整篇论文推翻从来,这跟拒稿没有区别。

    12、BIOCHIMIE 3.413
    中科院大类分区 生物:3区
    中科院小类分区 生化与分子生物学 3区
    平均审稿速度:网友分享经验:较快,2-4周
    来源Elsevier官网:平均7.8周
    平均录用比例:网友分享经验:较易
    来源Elsevier官网:39%

    13、BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS 2.985
    中科院分区
    大类:生物 3区
    小类:生化与分子生物学 4区|生物物理 3区
    2019.3.29文章投出,4.3分配了手稿号,4.7决定直接录用,非常迅速。该期刊特点是无论接收还是拒绝都恢复迅速,比较适合即将毕业的人员赶时间选刊。期刊涉及研究领域比较宽泛,医学,生物学,药物化学等交叉学科,为不同研究类型都提供了空间。
    第一次投拒了,但是意见里说删减内容可以重投
    按要求改好后投回去,5天接收。
    实际发生于2019-6.
    最近投了,直接拒。理由:数据扎实但是领域过于小,不能引起广泛的关注。

    14、JOURNAL OF THEORETICAL BIOLOGY 2.327
    中科院分区
    大类:生物 4区
    小类:数学与计算生物学 3区|生物学 3区
    平均审稿速度:网友分享经验:平均3.0个月
    来源Elsevier官网:平均14.2周
    平均录用比例:网友分享经验:约50%

    15、Journal of Translational Medicine 4.098
    中科院分区
    大类:医学 2区
    小类:医学:研究与实验 2区推荐理由:1.2020年接收纯生信文章;2. 年发文量一般(424篇);2. 对生信文章的发文的工作量和可视化程度要求都不高
    年刊文量一直都很稳定,基本维持在300多篇
    因此,国人在该刊上发表文章的数目正在逐年增加,占据的比例超过40%。由此可见,该刊对国内学者比较友好,而且也逐渐深得国人之心。

    16、International Immunopharmacology 3.943
    中科院分区
    大类:医学 3区
    小类:药学 3区|免疫学 3区
    平均审稿速度:网友分享经验:平均2.7个月
    来源Elsevier官网:平均7.5周
    平均录用比例:网友分享经验:约81.66%

    17、International Journal of Molecular Sciences 4.556
    中科院分区
    大类:生物 2区[Top]
    小类:化学综合 3区|生化与分子生物学 3区
    一个月内接受,效率确实高,送审很快,但是审稿过程还是严谨仔细的,对文章质量提升有所帮助。汤森路透jcr一区了,没以前好投了,需要有所创新,较完整的实验验证,原始实验数据和图片,一定的工作量,合乎4分 期刊的要求。

    18、BioMed Research International 2.276
    中科院分区
    大类:生物 3区
    小类:医学:研究与实验 4区|生物工程与应用微生物 3区
    审稿速度:3.0|投稿命中率:75.0|版面费用:2200.0
    偏重的研究方向:肿瘤诊断及预后
    1月6日投稿; 9月2日修回; 9月8日接收; 9月21日online,中间催了四次稿,后来只给了两个不痛不痒的的意见,很不专业,也是不等着文章用,建议慎投!
    审稿速度是真的慢,几个月后给你来一句没找到审稿人

    19、J CELL PHYSIOL/JOURNAL OF CELLULAR PHYSIOLOGY 5.546
    中科院分区
    大类:生物 2区
    小类:细胞生物学 3区|生理学 2区
    平均审稿速度 网友分享经验:平均1.0个月
    平均录用比例 网友分享经验:较难
    属于生物行业,“生理学”子行业的优秀级杂志。 投稿难度评价:中等偏上杂志,要求也较高,此区杂志很多,但是投中,并不容易 审稿速度:较快,2-4周
    审稿速度:3.0|投稿命中率:50.0
    经验分享:非常支持期刊今年七月才出的要求提供所有原始图片及wb的marker等,这是一本对中国人很友好的期刊,影响因子也不错,已经出现了一次造假文章被撤的事件,再来一次可能真的就要被SCI除名了,到时候所有人都要凉凉了。所以国人们请谨慎灌水

    20、Computational Biology and Chemistry 1.850
    中科院分区
    大类:生物 4区
    小类:计算机:跨学科应用 4区|生物学 4区
    审稿速度:7.0
    经验分享:这个期刊速度很慢很慢,大家谨慎投,

    21、Journal of Cellular and Molecular Medicine 4.486
    中科院分区
    大类:医学 2区
    小类:细胞生物学 3区|医学:研究与实验 2区
    JCMM杂志主要关注生理学、细胞医学、分子生物学等,以下方向的研究也均可投稿尝试,包括:
    病理学、药理学、公共卫生、实验医学、心血管病学、心脏病学、癌症、组织工程学、神经科学、生物化学、干细胞、基因组学、小分子核糖核酸、蛋白质组学、细胞凋亡、阿尔茨海默病、再生医学、表观遗传学、脓毒症等。
    投稿经验
    由于有人指出该刊可能被剔除SCI,因此,我也在网上找到了一些学者的看法和投稿经验。发现还真有不少学者担心该刊会被踢,甚至还有学者造谣该刊已经被踢。
    特意查询了一下JCMM期刊,发现该刊还被收录在SCI数据库,
    虽然国内学者论文占比越来越高,而且版面费也略贵,但是该刊自引率很低,影响因子维持在4分+,并且没有太大幅度变化。
    因此,总体来说JCMM期刊近几年应该不会被剔除SCI。
    但是既然众多学者提出来,说明该刊还存在一些问题,各位投稿者也需要谨慎对待。

    22、PLoS Computational Biology 4.700
    中科院分区
    大类:生物 2区
    小类:生化研究方法 2区|数学与计算生物学 1区
    平均审稿速度:网友分享经验:平均3.0个月
    平均录用比例:网友分享经验:很难

    23、IEEE Journal of Biomedical and Health Informatics 5.223
    中科院SCI期刊分区
    ( 2020年12月最新升级版)
    大类学科 小类学科 Top期刊 综述期刊
    工程技术2区
    MATHEMATICAL & COMPUTATIONAL BIOLOGY
    数学与计算生物学 1区
    MEDICAL INFORMATICS
    医学:信息 1区
    COMPUTER SCIENCE, INFORMATION SYSTEMS
    计算机:信息系统 2区
    COMPUTER SCIENCE, INTERDISCIPLINARY APPLICATIONS
    计算机:跨学科应用 2区
    一审大约一个半月
    三个审稿人,编辑给了大修
    大修改完投出去一个月返回小修意见
    小修改完投出去一个月返回接收
    总的来说:很好地期刊,负责的态度
    投稿经验:
    大修7个审稿人,提了很多修改意见,修改了两个多月后返回。后面又经过了两轮小修后接收。
    总体来说,虽然过程比较曲折,但是审稿速度很快,编辑也很负责。希望期刊越办越好。

    24、Journal of Biomedical Informatics 3.526
    中科院分区
    中科院分区表对汤森路透每年度发布的期刊引证报告(JOURNAL CITATION REPORTS,简称JCR)中SCI期刊在学科内依据3年平均影响因子划分分区。它包括大类分区和小类分区:大类分区是将期刊按照自定义的13个学科所做的分区,大类分区包括Top期刊;而小类分区是将期刊按照JCR已有学科分类体系所做的分区。
    大类:医学 3区
    小类:医学:信息 3区|计算机:跨学科应用 3区
    经验分享:不错的期刊,生物信息学类里面比较好的。
    审稿速度:2.0
    经验分享:2019年11月19投出。
    2020年1月24外审。
    2020年3月13通知大修。
    2020年4月1号逐条答复修改意见并提交大修到系统。
    2020年4月25号收到录用通知。

    展开全文
  • 福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现安排《临床基因组学数据分析实战》于2021年11月12-14 线上/线下课程 (线上课是通过腾讯会议实时直播线下课,实时互...
  • 生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据fastq之外,还需要准备基因组文件fasta格式和基因注释文件gtf格式。在分析的过程中还会有众多中间文件的生成,如bed、bed12、sam、bam、wig、bigwig...
  • 生信开发人员最头疼的问题,可能就是平台搭建和软件安装了。部署和迁移上要费很大力气。本文讲述使用docker制作一个镜像,后续通过导入自己定制的镜像,复制文件完成分析流程的部署和迁移。 如何使用docker,推荐...
  • 美国Minnesota大学的生信全套课件 主要讲解用perl 脚本来数据下机数据
  • 生信文件格式汇总

    2020-10-18 20:47:06
    生信数据文件格式。 vcf Variant Call Format(VCF):是一个用于存储基因序列突变信息的文本格式。可以表示单碱基突变, 插入/缺失, 拷贝数变异和结构变异等,即SNP, indel, 和 structural variation calls。通常是...
  • 具体的使用方法可参见 【生信笔记】PPT课件|Linux系统安装与基本使用方法 Linux系统在生物信息学数据处理方面的重要性不言而喻,本公众号接下来将基于Windows系统的Linux子系统推出系列生物信息学学习笔记,旨在帮助...
  • 生信网站整理

    千次阅读 2019-05-30 17:14:59
    生信网站整理前言生信课程和推荐博客语言PythonRPerl生信分析流程案例GWAS甲基化其他 前言 在生信学习过程中我保存了很多网站,但是因为没有对网站进行记录和管理经常找不到需要的信息,在这篇博客中将汇总我收藏...
  • 1 Conda安装 1.1 Conda介绍 Conda是一种开源的软件包和环境管理软件,用于安装和转换...考虑到用于生信工作一些常用包反而可能并不常用,我个人建议下载精简版。 Miniconda下载地址:https://conda.io/minicond...
  • 生信入门(七)——数据预处理1 文章目录生信入门(七)——数据预处理1一、用基本包处理数据框1.查看数据框中的内容2、选取数据库的子集3、将数据按照某个变量的值排序:order()4、查找和删除数据:duplicated()5、...
  • 生信,恰好就是生物学和计算机的交叉学科,假如班上100个学生,你生物进前50名,那么在这50个人中,如果你计算机也能排前50%,那么你就进入前四分之一了。因此,跨界,是在职场上取得优势的捷径。 搞生信..
  • ​导语:这是本系列的最后一期了,继续给大家介绍几个实用的生信小工具1. WebLogo 3 (http://weblogo.threeplusone.com/)我们阅读文献时肯定看到过下面这种图,它叫序列标识图(Sequence logo),是基于多序列比对的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 11,208
精华内容 4,483
关键字:

生信