精华内容
下载资源
问答
  • 基因富集分析是指对于给定一组基因根据基因组注释信息(GO、KEGG)对基因进行聚类分析,即给定的基因是不是GO中的一个功能(或KEGG中的一个通路)。 基因的功能富集的目的说明给定的基因集对哪些功能的影响有针对性...

    概念:

    基因富集分析是指对于给定一组基因根据基因组注释信息(GO、KEGG)对基因进行聚类分析,即给定的基因是不是GO中的一个功能(或KEGG中的一个通路)。

    基因的功能富集的目的是说明给定的基因集对哪些功能的影响有针对性的,不是随机影响的。

    原理:

    基因富集分析是通过研究给定的基因集在功能节点上是否过出现得到关注的基因集显著注释的功能节点。通常利用超几何分布等方法计算给定基因在某个功能(或通路)上的P值,判断给定的基因在功能(或通路)的基因数目超过了随机的期望,是一个小概率事件

    变量差异表达分析
    N基因组所有基因、所有分析的基因
    x差异表达基因集中有功能F的基因
    MN中具有某种功能(F)的基因总数
    K差异表达基因

     clusterProfiler包进行GO、KEGG富集分析:

    1.加载R包,下载R包请参考:

    富集分析--R包--clusterProfiler下载安装与报错分析解决_Tian問的博客-CSDN博客

    #加载包
    library(clusterProfiler)
    library(org.Hs.eg.db)
    library(topGO)

    ●  clusterProfiler包由Y叔开发,可以进行基因及基因簇的分析和基因谱功能可视化,功能强大。

    ●   org.Hs.eg.db人类的基因组注释包进行基因ID的转换

    ●  topGO包辅助绘制GO富集分析结果的有向无环图

    2、数据准备,筛选感兴趣的基因集

    #自行选择筛选自己感兴趣的基因集
    gene_set <- rownames(pro_result[which(pro_result$FDR < 0.01 & abs(pro_result$log2FC) >= 2),])

    ●  根据自己的需求获取差异基因

    3、基因ID转换

    gene_symbol <- bitr(geneID = gene_set,  #感兴趣的基因集
                        fromType="ENSEMBL",   #输入ID的类型
                        toType=c("SYMBOL", "ENTREZID"),   #输出ID的类型,可为多个
                        OrgDb="org.Hs.eg.db")  #物种注释数据库

    ●  可能出现部分ID无法匹配的结果,通常输出的ID少于输入的ID

    4、GO富集分析

    gene <- gene_symbol[,3]
    CC <- enrichGO(gene = gene,  #基因列表(转换的ID)
                   keyType = "ENTREZID",  #指定的基因ID类型,默认为ENTREZID
                   OrgDb=org.Hs.eg.db,  #物种对应的org包
                   ont = "CC",   #CC细胞组件,MF分子功能,BF生物学过程
                   pvalueCutoff = 0.01,  #p值阈值
                   pAdjustMethod = "fdr",  #多重假设检验校正方式
                   minGSSize = 1,   #注释的最小基因集,默认为10
                   maxGSSize = 500,  #注释的最大基因集,默认为500
                   qvalueCutoff = 0.01,  #p值阈值
                   readable = TRUE)  #基因ID转换为基因名

    #展示GO的CC的富集结果result
    df <- CC@result

    ●  ID:GO数据库ID

    ●  Decription:基因功能描述

    ●  GeneRAatio:K/x

    ●  BgRatio:M/N

    ●  pvalue,qvalue:p值和校正过的p值

    ●  count:差异基因的数目

     5、GO富集分析可视化

    5.1绘制点图

    dotplot(CC,  #GO富集分析结果
            x = "GeneRatio",  #横坐标,默认GeneRation,也可以为Count
            color = "p.adjust",  #右纵坐标,默认p.adjust,也可以为pvalue和qvalue
            showCategory = 20,  #展示前20个点,默认为10个
            size = NULL,  #点的大小
            title = "CC_dotplot"  #设置图片的标题
            )

     5.2绘制条状图

    barplot(CC,  #GO富集分析结果
            x = "Count",  #横坐标,默认Count,也可以为GeneRation
            color = "p.adjust",  #右纵坐标,默认p.adjust,也可以为pvalue和qvalue
            showCategory = 20,  #展示前20个,默认为10个
            size = NULL,  
            title = "CC_barplot"  #设置图片的标题
            )

     5.3GO富集分析的有向无环图(DAG)

    plotGOgraph(CC,  #输出enrichGO或gseGO的有向无环图(与输入的对象对应)
                firstSigNodes = 10,  #显著性节点的个数,默认10个
                useInfo = "all",  
                sigForAll = T,  #是否在所有节点展示score/p-value
                useFullNames = T,  #是否使用全称
                )

     ●  在GO富集分析的有向无环图(DAG)中,方形是默认输出的显著性最高的前10个节点;且颜色的深浅表示显著性,颜色越深,越显著。

    ●  图形中内容的含义:

     自上而下,依次为:

    ●  GO数据库中编号(ID)

    ●  节点功能注释

    ●  p值

    ●  K/M

     6、KEGG富集分析

    KEGG<- enrichKEGG(gene = gene,   #基因列表(同GO) 
                      organism = "hsa",  #物种
                      keyType = "kegg",  #指定的基因ID类型,默认为kegg
                      minGSSize = 1, 
                      maxGSSize = 500,
                      pvalueCutoff = 0.01,  
                      pAdjustMethod = "fdr",
                      qvalueCutoff = 0.01)

     

     

    #展示GO的CC的富集结果result
    df <- KEGG@result

      7、KEGG富集分析可视化

    KEGG可视化的点图和条图和GO富集分析可视化一致,不在展示,且KEGG不可绘制DAG图

     

    GO和KEGG富集分析还可以借助其他R包绘制诸如热图、弦图,大家可自行学习


    感谢您的查看,致谢!(`・ω・´)ゞ(`・ω・´)ゞ

    欢迎关注公众号《生信Tian問的笔记》ε≡٩(๑>₃<)۶ 一心向学

     

     

     

    展开全文
  • GO and KEGG富集分析

    2021-09-15 16:36:12
    orderBy="x",title="Enrichment GO") #KEGG分析 enrich_kegg (gene = gene, organism = 'hsa', # 对应 KEGG 物种缩写 keyType = 'kegg', pvalueCutoff = 0.05, qvalueCutoff = 0.05 ) barplot(enrich_kegg, show...
    GO

    基因本体涉及的基因和基因产物词汇分为三大类,涵盖生物学的三个方面:
    细胞组分(cellular component)CC:细胞的每个部分和细胞外环境。
    分子功能(molecular function)MF:可以描述为分子水平的活性(activity),如催化(catalytic)或结合(binding)活性。
    生物过程(biological process)BP:生物学过程系指由一个或多个分子功能有序组合而产生的系列事件。其定义有广义和狭义之分,在词义上可以区分为泛指和特指。一般规律是,一个过程是由多个不同的步骤组成。需要指出的是,生物学过程与途径或通路(pathway)不是同一回事。

    KEGG

    GO分析好比是将基因分门别类放入一个个功能类群的篮子,而pathway则是将基因一个个具体放到代谢网络中的指定位置。

    kegg物种支持查询

    http://www.genome.jp/kegg/catalog/org_list.html
    ssc #sus
    hsa #human
    mmu #Mus musculus (mouse)

    #示例数据
    gene = "TP53,BRCA1,KRAS,PTEN,RUNDC3A,MAPK8IP2,PSD,JPH3,PELI3,STMN3,CDK5R2,AP3B2,SVOP,GRIN1,SNCB,RLTPR,STX1B,RP11-1263C18.1,KCNC1,LRRC73,KCNT1,PRRT1,SEPT5,CTD-2228A4.1,RP11-482M8.3,CPLX1,PNMA3,CKMT1A,PPP1R3F,CABP1,CKMT1B,SCAMP5,PPFIA3,PDZD4,FBXO41,CHRM1,AC091878.1,SPRN,UBE2QL1,CACNA1I,FAIM2,SYP,ARHGDIG,SYT4,MADD,CEND1,RP11-95O2.1,DLG4,CNNM1,EIF4E1B,MAPRE3,PRKAG2-AS1"
    gene = unlist(strsplit(gene,','))
    
    #安装clusterProfiler包
    #if (!requireNamespace("BiocManager", quietly = TRUE){install.packages("BiocManager")}
    #BiocManager::install("clusterProfiler")
    #BiocManager::install("org.Hs.eg.db")
    
    library(clusterProfiler)
    library("org.Hs.eg.db")
    
    #gene symbol id to entrez id
    gene = bitr(gene, fromType="SYMBOL", toType="ENTREZID", OrgDb="org.Hs.eg.db")
    gene = gene$ENTREZID
    #下面这个也可以进行id转换
    #entrezid <- select(org.Hs.eg.db, keys=gene, columns = 'ENTREZID', keytype = 'SYMBOL')
    
    #GO分析
    enrich_go <- enrichGO(gene=gene, 
                          OrgDb = 'org.Hs.eg.db', 
                          keyType = 'ENTREZID', 
                          ont = 'ALL', #BP,CC,MF
                          pvalueCutoff = 0.05, #pvalue cutoff
                          qvalueCutoff = 0.05, #qvalue cutoff
                          readable = TRUE #whether mapping gene ID to gene Name
                          )
    
    write.csv(summary(enrich_go),"GO_enrich.csv",row.names =F)
    barplot(enrich_go, showCategory = 30,title="Enrichment GO")
    dotplot(enrich_go, showCategory = 30,orderBy="x",title="Enrichment GO")
    
    #KEGG分析
    enrich_kegg <- enrichKEGG(gene = gene, 
                              organism = 'hsa', # 对应 KEGG 物种缩写
                              keyType = 'kegg',
                              pvalueCutoff = 0.05,
                              qvalueCutoff = 0.05
                              )
    
    barplot(enrich_kegg, showCategory = 30,title="Enrichment KEGG")
    dotplot(enrich_kegg, showCategory = 30,title="Enrichment KEGG",orderBy="x")
    
    #enrichKEGG没有readable这个参数?,自己写个函数实现类似功能的转换
    #entrezid to symbol
    entrezid_2_symbol <- function(gene_list){
      gene_list=bitr(unlist(strsplit(gene_list, '/')), fromType="ENTREZID", toType="SYMBOL", OrgDb="org.Hs.eg.db")
      gene_list=paste(gene_list$SYMBOL,collapse = '/')
      gene_list
    }
    
    kegg_result=summary(enrich_kegg)
    kegg_result$geneID=unlist(lapply(kegg_result$geneID, entrezid_2_symbol))
    write.csv(kegg_result,"KEGG_enrich.csv",row.names =F)
    
    展开全文
  • 首先考虑一个问题: clusterProfiler做 GO 和 KEGG 富集分析的注释信息来自哪里? GO 的注释信息来自 Bioconductor,提供了19个物种的 org 类型的 GO 注释信息,如下表所示。Bioconductor 中更多的注释包可参考下面...

    以下文章来源于简书,作者 biobin,文章已获原作者授权。


    前言


    关于 clusterProfiler这个 R 包就不介绍了,网红教授宣传得很成功,功能也比较强大,主要是做 GO 和 KEGG 的功能富集及其可视化。简单总结下用法,以后用时可直接找来用。

    首先考虑一个问题: clusterProfiler做 GO 和 KEGG 富集分析的注释信息来自哪里?

    GO 的注释信息来自 Bioconductor,提供了19个物种的 org 类型的 GO 注释信息,如下表所示。Bioconductor 中更多的注释包可参考下面这个链接,很乱,大多数我都不知道干啥用的。
    • http : //w ww.bioconductor.org/packages/release/data/annotation/
    b5c563d0-7471-490e-b492-cb7a90945ea5.png
    KEGG 的注释信息 clusterProfiler通过 KEGG 数据库的 API 来获取, https://www.kegg.jp/kegg/rest/keggapi.html

    首先是一个物种所有基因对应的 pathway 注释文件,比如人的:http://rest.kegg.jp/link/hsa/pathway

    其次还需要 pathway 的描述信息,比如人的:http://rest.kegg.jp/list/pathway/hsa

    关于 KEGG 数据库全部的物种及其简写(三个字母)如下列表(部分截图):

    4fdeb8b5-6cbc-40fc-8269-1bbdafa28216.png
    https://www.genome.jp/kegg/catalog/org_list.html

    因此对于以上已有 pathway 注释的物种,只需要将物种简写输入给clusterProfiler, 它会通过联网自动获取该物种的 pathway 注释信息。

    以上都是有物种信息的情况,那么对于无物种信息的项目怎么办?

    GO 可以通过读取外部的 GO 注释文件进行分析。关于基因的 GO 注释,interproscaneggnog-mapperblas2go等软件都可以做,不过输出格式有些不同。clusterProfiler需要导入的 GO 注释文件的格式如下:

    feea5ac3-fdc8-48ef-aab6-e3d6b5a6bb2b.png

    需要包含以上三列信息,这 3 列信息任意顺序都可。

    clusterProfiler包只针对含有 OrgDb 对象,如果是公共数据库中有该物种注释信息,只是未制作成 org.db 数据库(标准注释库),则可以不需要从头注释,只需手动制作 org.db 数据库类型,完成后直接使用即可,代码如下:

    source("https://bioconductor.org/biocLite.R")
    if (!requireNamespace("BiocManager", quietly = TRUE))
      install.packages("BiocManager")

    BiocManager::install("AnnotationHub"# 一个包含大量注释信息的数据库,里面有很多物种及来源于很多数据库的注释信息。
    BiocManager::install("biomaRt")

    library(AnnotationHub) 
    library(biomaRt)

    hub <- AnnotationHub() # 建立AnnotationHub对象(视人品,网不行加载不了)
    # unique(hub$species) # 查看AnonotationHub里面物种
    hub$species[which(hub$species=="Solanum")] # 看AnonotationHub里是否包含想要的物种
    # Solanum是番茄的拉丁名
    query(hub, "Solanum")  # 查看该物种信息
    hub[hub$species=="Solanum" & hub$rdataclass == "OrgDb"# OrgDb属于rdataclass中,因此查看下该物种有没有OrgDb
    Solanum.OrgDb <- hub[["AH59087"]] # AH59087是番茄对应的编号
    # 制作为标准注释库,就可和模式生物一样使用了

    同样地,对于 pathway 数据库中没有的物种,也支持读取基因的 pathway 注释文件,然后进行分析,注释文件的格式如下:

    be7260ed-3e6d-48b7-8df7-9133681ac8bf.png
    以上三列信息的顺序也是任意的


    富集分析

    通常用的富集分析有 ORA、FCS 和拓扑三种方法。ORA 简单来说就是超几何检验或 Fisher 精确检验,大同小异,都符合超几何检验,这也是目前用的最多的方法,优劣不谈。FCS 的代表就是 GSEA,即基因集富集分析,优劣亦不谈。clusterProfiler提供了这两种富集分析方法。

    1. ORA(Over-Representation Analysis)

    GO 富集参考代码:

    #标准富集分析
    ego <- enrichGO(
              gene  = gene$entrzID,
              keyType = "ENTREZID"
              universe = names(geneList), #背景基因集,可省
              OrgDb   = org.Hs.eg.db,
              ont     = "CC",
              pAdjustMethod = "BH",
              pvalueCutoff  = 0.01,
              qvalueCutoff  = 0.05,
              readable      = TRUE)

    #通过导入外部注释文件富集分析
    data <- read.table("go_annotation.txt",header = T,sep = "\t")
    go2gene <- data[, c(21)]
    go2name <- data[, c(23)]
    x <- enricher(gene,TERM2GENE = go2gene,TERM2NAME = go2name)

    一些参数说明:
    • gene:差异基因对应的向量;

    • keyType:指定基因ID的类型,默认为 ENTREZID, 可参考keytypes(org.Hs.eg.db)类型 ;

    • OrgDb:指定该物种对应的 org 包的名字;

    • ont:代表 GO 的 3 大类别,BP,CC,MF,也可是全部 ALL;

    • pAdjustMethod:指定多重假设检验矫正的方法,有"holm""hochberg""hommel""bonferroni""BH""BY""fdr""none"中的一种;

    • cufoff:指定对应的阈值;

    • readable=TRUE:代表将基因 ID 转换为 gene symbol。


    KEGG Pathway 富集参考代码:

    
        
        
        #标准富集分析
     
         
         
         
    ego <- enrichKEGG(
              gene = gene,
              keyType =  "kegg",
              organism  =  'hsa',
              pvalueCutoff  =  0.05,
              pAdjustMethod  =  "BH",
              qvalueCutoff  =  0.05
    )


    #通过外部导入注释文件富集
    data <- read.table( "pathway_annotation.txt",header =  T,sep =  "\t")
    go2gene <- data[, c( 21)]
    go2name <- data[, c( 23)]
    x <- enricher(gene,TERM2GENE = go2gene,TERM2NAME = go2name)
    • 默认基因 ID 为 kegg gene id,也可以是 ncbi-geneid,ncbi-proteinid,uniprot 等。

    • organism 物种对应的三字母缩写,其他参数同 GO 富集。


    ID 转换函数:

    library(clusterProfiler)
    bitr_kegg("1",fromType = "kegg",toType = 'ncbi-proteinid',organism='hsa')

    library(org.Hs.eg.db)
    keytypes(org.Hs.eg.db) #支持的ID类型
    bitr(gene, fromType = "ENTREZID", toType = c("ENSEMBL""SYMBOL"), OrgDb = org.Hs.eg.db)

    #以上看出ID转换输入时,可以向量的形式,也可以单列基因名list导入,也可以是内置数据
    gene <- c("AASDH","ABCB11","ADAM12","ADAMTS16","ADAMTS18")
    gene  <-  data$V1 #字符串

    data(geneList, package="DOSE"#富集分析的背景基因集
    gene <- names(geneList)[abs(geneList) > 2]


    2. GSEA(Gene Set Enrichment Analysis)

    GO 富集参考代码:
    #标准富集分析
    ego <- gseGO(
          geneList  = geneList,
          OrgDb  = org.Hs.eg.db,
          ont  = "CC",
          nPerm  = 1000,  #置换检验的置换次数
          minGSSize  = 100,
          maxGSSize  = 500,
          pvalueCutoff = 0.05,
          verbose  = FALSE)

    #通过导入外部注释文件富集分析参考代码:
    data <- read.table("go_annotation.txt",header = T,sep = "\t")
    go2gene <- data[, c(21)]
    go2name <- data[, c(23)]
    x <- GSEA(gene,TERM2GENE = go2gene,TERM2NAME = go2name)

    KEGG Pathway 富集参考代码:
    #标准富集分析
    kk <- gseKEGG(
      geneList  = gene,
      keyType  = 'kegg',
      organism = 'hsa',
      nPerm  = 1000,
      minGSSize = 10,
      maxGSSize = 500,
      pvalueCutoff = 0.05,
      pAdjustMethod     = "BH"
    )

    #通过外部导入注释文件富集
    data <- read.table("pathway_annotation.txt",header = T,sep = "\t")
    go2gene <- data[, c(21)]
    go2name <- data[, c(23)]
    x <- GSEA(gene,TERM2GENE = go2gene,TERM2NAME = go2name)


    可视化


    1. GO 富集分析结果可视化


    #barplot
    barplot(ego, showCategory = 10#默认展示显著富集的top10个,即p.adjust最小的10个

    #dotplot
    dotplot(ego, showCategory = 10)

    #DAG有向无环图
    plotGOgraph(ego)  #矩形代表富集到的top10个GO terms, 颜色从黄色过滤到红色,对应p值从大到小。

    #igraph布局的DAG
    goplot(ego)

    #GO terms关系网络图(通过差异基因关联)
    emapplot(ego, showCategory = 30)

    #GO term与差异基因关系网络图
    cnetplot(ego, showCategory = 5)


    2. Pathway 富集分析结果可视化


    #barplot
    barplot(kk, showCategory = 10)

    #dotplot
    dotplot(kk, showCategory = 10)

    #pathway关系网络图(通过差异基因关联)
    emapplot(kk,  showCategory = 30)

    #pathway与差异基因关系网络图
    cnetplot(kk, showCategory = 5)

    #pathway映射
    browseKEGG(kk, "hsa04934"#在pathway通路图上标记富集到的基因,会链接到KEGG官网


    37d557c2-de67-42ed-9e8d-88c5d913b202.png — END—

    78f65bae-78bc-42a1-a2a7-3e6e873edba5.png


    2c951972-8433-4dba-8c1e-7e47ad25f9d0.gif 戳原文,更有料!

    本文分享自微信公众号 - 生信科技爱好者(bioitee)。
    如有侵权,请联系 support@oschina.cn 删除。
    本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

    展开全文
  •   概念: GO是基因本体联合会所建立的数据库,旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语义词汇标准。GO 提供了一系列的语义...GSEA:基因集富集分析,用

    概念:

    GO是基因本体联合会所建立的数据库,旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语义词汇标准。GO 提供了一系列的语义用于描述基因功能的概念/类,以及这些概念之间的关系。

    KEGG(京都基因与基因组百科全书)是了解高级功能和生物系统,从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源,是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。

    GSEA:基因集富集分析,用于确定先验基因集是否在两种生物状态(例如表型)之间差异显著。

    区别:

    GO/KEGG差异基因的一刀切法——仅关注少数几个显著上调或下调的基因,容易遗漏部分差异表达不显著却有重要生物学意义的基因,忽略一些基因的生物特性、基因调控网络之间的关系及基因功能和意义等有价值的信息
    GSEA不需要指定明确的差异基因阈值,算法根据实际整体趋势分析。

    最后我所做的所有分析与教程的代码都会在我的个人公众号中,请打开微信搜索“生信学徒”进行关注,欢迎生信的研究人员和同学前来讨论分析。
    ps:公众号刚刚建立比较简陋,但是该有的内容都不会少。

    展开全文
  • 对于非模式生,可以先做KEGG注释,用注释文件直接进行计算,GO富集同理。 用到三个文件 1.背景基因的注释信息(所有可以注释到的基因),两列 2.ko的描述信息文件,两列 3.差异基因文件(软件会自动删掉没有注释到的...
  • KEGG富集分析散点图.md

    千次阅读 2019-06-13 08:37:00
    pathway = read.table("kegg.result",header=T,sep="\t") pp = ggplot(pathway,aes(richFactor,Pathway)) #Pathwy是ID,richFactor是富集的基因数目除以背景的基因数目 # 改变点的大小 pp + geom_point(aes(size=R...
  • DAVID 在线数据库进行 GO/ KEGG 富集分析

    万次阅读 多人点赞 2019-12-18 17:24:35
    1、功能富集分析 随着高通量技术的发展,生物医学相关研究领域进入了组学时代,单个基因的研究已经不能满足研究人员的需要。然而,如此庞大的数据使得信息的有效提取和分析带来了新的挑战。以测序数据为例,测序结果...
  • RNA-seq寻找到差异基因后,对比GO与KEGG库进行差异分析 rm(list = ls()) options(stringsAsFactors = F) DEG <- read.csv('./DEGs_filter.csv', header = T, row.names = 1) gene <- DEG$Entrezid genelist...
  • 使用clusterProfiler进行KEGG富集分析

    万次阅读 2018-11-05 10:14:32
    KEGG pathway是最常用的功能注释数据库之一,可以利用KEGG 的API获取一个物种所有基因对应的pathway注释,human对应的API 链接如下 http://rest.kegg.jp/link/hsa/pathway 通过该链接可以获得以下内容 path:hsa...
  • 文章目录论文地址DAVID官网获得KEGG富集分析结果气泡图cytoscape软件绘制代谢通路网络图network datatable data 论文地址 DAVID官网 KEGG富集分析和GO富集分析方法一致,具体步骤见我上篇文章DAVID在线工具进行GO...
  • 系列文章目录 文章目录 单细胞测序流程(一)简介与数据... 单细胞测序流程(七)单细胞的细胞类型轨迹分析单细胞测序流程(八)单细胞的marker基因转化和​GO富集分析 单细胞测序流程(九)单细胞的GO圈图
  • KEGG 通路富集分析图解

    万次阅读 2021-01-29 16:20:44
    KEGG 通路富集分析 KEGG数据库 KEGG(京都基因和基因组百科全书)数据库是日本京都大学生物信息学中心的Kanehisa实验室于1995年建立了的生物信息学数据库。现在是基因组测序和其他高通量实验技术产生的大规模分子...
  • 在上次转录组可视化课程中,有位老师看到富集分析泡泡图的图例中的Count存在小数,于是提出了这么一个问题:为什么基因的数目有小数?之前没有注意过这个问题,应该是ggplot2默认的图例生成...
  • 无参转录组GO、KEGG富集分析——diamond+idmapping+GOstats

    万次阅读 多人点赞 2018-03-29 18:54:19
    (1)用无参转录组分析软件得到unigene fasta文件,命名为my_unigenes.fa,格式如下表所示: &gt;MSTRG.5.1 gene=MSTRG.5 TGATGTCATCGATCCGTGACGTTTAGTATTCAACCAATAGGAATCAACCACGTAGGATTGGCGATCCTCG ...
  • KEGG-GO注释分析代码.R

    2020-05-10 15:26:48
    转录组分析差异表达基因注释时,用R语言的biocondcouter分析,根据代码,搜索需要分析的物种,就可出来结果
  • KEGG基因富集分析

    千次阅读 2019-09-29 15:13:44
    #kegg:基因功能存储在pathway数据库里 rm(list = ls()) ## 魔幻操作,一键清空~ load(file = 'deg.Rdata') head(deg) ## 不同的阈值,筛选到的差异基因数量就不一样,后面的超几何分布检验结果就大相径庭。 ...
  • GO和KEGG富集教程

    千次阅读 2021-03-12 12:55:34
    Go和KEGG富集教程前提操作步骤注释中心库 前提 假设现在你已经在R官网上下载并安装好了R,并且已经有了自己的基因数据,例如一个excel表格中存放的数据。如下面这种形式。 现在需要做GO富集和KEGG的富集并生成想要...
  • 用R做GO功能注释和KEGG通路富集分析

    万次阅读 多人点赞 2019-04-19 14:42:08
    KEGG -GO主要是使用R 中clusterProfiler包进行富集分析 以及使用pathview 包进行代谢途径整合和可视化。 进行在线分析的:https://pathways.embl.de/ 1.代码:...
  • KEGG enrichment富集分析我至今搞不懂原因的问题

    千次阅读 热门讨论 2020-02-27 22:30:55
    最近做了人类和小鼠的RNAseq分析,在做KEGG enrichment同时遇到相同的报错,特地截图如下: 没错,就是说, Error in download.KEGG.Path(species) : 'species' should be one of organisms listed in '...
  • library(ggplot2) p <- ggplot(gene_dx, aes(x=pathway_name, y=-log10(value))) p + geom_bar(stat="identity", position="dodge", aes(fill=leibie)) p + geom_bar(stat="identity", position="dodge", ...
  • R语言:GO富集分析KEGG分析

    万次阅读 多人点赞 2019-05-08 03:08:44
    转录组学习(功能富集分析) BiocManager::install("AnnotationHub") #下载安装数据包,缺少的数据包都可以这样安装 library(AnnotationHub) #library导入需要使用的数据包 library(org.Hs...
  • R语言:GO富集和KEGG富集、可视化教程,附代码

    千次阅读 热门讨论 2021-04-16 10:24:16
    R语言:GO富集和KEGG富集、可视化教程,附代码 小白一枚,博客仅用于记录自己的学习历程,参考了很多代码,感觉有些代码太复杂了,根据自己的喜欢进行了部分改动。 1.文件准备 导入准备好的差异基因列表,或者是某个...
  • KOBAS的介绍KOBAS是北大生物信息中心研发的一个网页工具,用来基因/蛋白功能注释(注释模块)和功能基因集富集(富集模块)。以下是KOBAS的英文介绍:KOBAS 3.0 is a web server for gene/protein functional annotation...
  • win10-R语言3.6.2-Bioconductor依赖管理&&KEGG富集分析&&通路图&&pathview报错解决 一、环境准备 下载安装包(64位),(如果没有翻墙,选择国内的源进行下载)链接如下: ...
  • 桑吉气泡图 -- KEGG富集气泡图升级版,5维展示富集结果 Kegg通路或者GO本体论富集分析是基因功能注释最常见的分析,结果可以以多种形式展示,最常用的包括:条形图/bar图,气泡图/dot图等,其中气泡图输入数据...
  • GO分析KEGG分析都是啥?

    千次阅读 2020-10-12 15:48:14
    几乎现在的套路性文章在做完差异表达分析后,都会去做GO和KEGG富集分析。那么GO和KEGG都是什么?富集分析又是个什么东西呢? 01 为什么做富集分析? 在我们进行差异表达分析的时候,我们会得到很多的差异...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 750
精华内容 300
关键字:

kegg富集分析