精华内容
下载资源
问答
  • 基因富集分析

    千次阅读 2018-06-15 21:41:54
    https://www.jianshu.com/p/a1f312b60569http://www.360doc.com/content/16/0711/10/26456292_574656968.shtmldiff_gene.entrez文件,是通过各种差异基因软件找出来的差异基因的entrez ID号列表,每一个ID号一行,...

    https://www.jianshu.com/p/a1f312b60569

    http://www.360doc.com/content/16/0711/10/26456292_574656968.shtml

    diff_gene.entrez文件,是通过各种差异基因软件找出来的差异基因的entrez ID号列表,每一个ID号一行,几百个差异基因就几百行

    http://blog.sciencenet.cn/blog-1509670-971259.html

    上述表格为差异基因的KEGG Pathway富集分析结果表格。

    ID: KEGG 数据库中通路唯一的编号信息。

    Description :Gene Ontology功能的描述信息

    GeneRatio:差异基因中与该Term相关的基因数与整个差异基因总数的比值

    BgRation:所有( bg)基因中与该ID相关的基因数与所有( bg)基因的比值

    pvalue: 富集分析统计学显著水平,一般情况下, P-value < 0.05 该功能为富集项

    p.adjust 矫正后的P-Value

    qvalue:对p值进行统计学检验的q值

    Count:差异基因中与该Term相关的基因数

    setwd("C:\\Users\\Administrator\\Desktop\\ref")

    a=read.table("diff_gene.entrez")

    require(DOSE)

    require(clusterProfiler)

    gene=as.character(a[,1])

    ego <- enrichGO(gene=gene,organism="human",ont="CC",pvalueCutoff=0.01,readable=TRUE)

    ekk <- enrichKEGG(gene=gene,organism="human",pvalueCutoff=0.01,readable=TRUE)

    write.csv(summary(ekk),"KEGG-enrich.csv",row.names =F)

    write.csv(summary(ego),"GO-enrich.csv",row.names =F)


    展开全文
  • R 实战 | 使用clusterProfiler进行多组基因富集分析clusterProfiler这个包我就不再介绍了,网上关于用这个包做的基础的富集分析的教程已经非常多了,今天主要介绍一...

    R 实战 | 使用clusterProfiler进行多组基因富集分析

    clusterProfiler这个包我就不再介绍了,网上关于用这个包做的基础的富集分析的教程已经非常多了,今天主要介绍一下使用compareCluster功能进行多组基因的富集分析。

    • 示例数据

    • 富集分析

      • 多个基因集的富集分析

      • 多个分组的富集分析

    • 基本用法

      • 参数

    • References

    • 往期

    示例数据

    library(clusterProfiler)
    data(gcSample) #载入
    str(gcSample) #数据集格式
    lapply(gcSample, head) #查看数据集
    > str(gcSample)
    List of 8
     $ X1: chr [1:216] "4597" "7111" "5266" "2175" ...
     $ X2: chr [1:805] "23450" "5160" "7126" "26118" ...
     $ X3: chr [1:392] "894" "7057" "22906" "3339" ...
     $ X4: chr [1:838] "5573" "7453" "5245" "23450" ...
     $ X5: chr [1:929] "5982" "7318" "6352" "2101" ...
     $ X6: chr [1:585] "5337" "9295" "4035" "811" ...
     $ X7: chr [1:582] "2621" "2665" "5690" "3608" ...
     $ X8: chr [1:237] "2665" "4735" "1327" "3192" ...
    > lapply(gcSample, head)
    $X1
    [1] "4597"  "7111"  "5266"  "2175"  "755"   "23046"
    
    $X2
    [1] "23450" "5160"  "7126"  "26118" "8452"  "3675" 
    
    $X3
    [1] "894"   "7057"  "22906" "3339"  "10449" "6566" 
    
    $X4
    [1] "5573"  "7453"  "5245"  "23450" "6500"  "4926" 
    
    $X5
    [1] "5982" "7318" "6352" "2101" "8882" "7803"
    
    $X6
    [1] "5337"  "9295"  "4035"  "811"   "23365" "4629" 
    
    $X7
    [1] "2621" "2665" "5690" "3608" "3550" "533" 
    
    $X8
    [1] "2665" "4735" "1327" "3192" "5573" "9528"

    富集分析

    多个基因集的富集分析

    xx <- compareCluster(gcSample, fun="enrichKEGG",
                         organism="hsa", pvalueCutoff=0.05)
    table(xx@compareClusterResult$Cluster) #每个基因集富集个数
    head(as.data.frame(xx)) #查看完整结果
    > table(xx@compareClusterResult$Cluster)
    
    X1 X2 X3 X4 X5 X6 X7 X8 
     0  3  3 18 10  1 15 19 
    > head(as.data.frame(xx))
      Cluster       ID                            Description GeneRatio
    1      X2 hsa04110                             Cell cycle    18/384
    2      X2 hsa05169           Epstein-Barr virus infection    23/384
    3      X2 hsa05340               Primary immunodeficiency     8/384
    4      X3 hsa04512               ECM-receptor interaction     9/187
    5      X3 hsa04060 Cytokine-cytokine receptor interaction    17/187
    6      X3 hsa04151             PI3K-Akt signaling pathway    19/187
       BgRatio       pvalue    p.adjust      qvalue
    1 126/8105 2.441211e-05 0.007470105 0.006989572
    2 202/8105 7.911793e-05 0.012105043 0.011326356
    3  38/8105 3.297441e-04 0.033633898 0.031470314
    4  88/8105 1.815667e-04 0.045098637 0.042158192
    5 295/8105 4.490651e-04 0.045098637 0.042158192
    6 354/8105 5.048355e-04 0.045098637 0.042158192
                                                                                                         geneID
    1                   991/1869/890/1871/701/990/10926/9088/8317/9700/9134/1029/2810/699/11200/23594/8555/4173
    2 4067/3383/7128/1869/890/1871/578/864/637/9641/6891/355/9134/5971/916/956/6850/7187/3551/919/4734/958/6772
    3                                                                       100/6891/3932/973/916/925/958/64421
    4                                                              7057/3339/1299/3695/1101/3679/3910/3696/3693
    5                      2919/4982/3977/6375/8200/608/8792/3568/2057/1438/8718/655/652/10220/50615/51561/7042
    6             894/7057/6794/2247/1299/3695/2252/2066/1101/8817/1021/5105/3679/3082/2057/3910/3551/3696/3693
      Count
    1    18
    2    23
    3     8
    4     9
    5    17
    6    19
    dotplot(xx) #气泡图
    8c1765814bae8418e83a864cf77dfb97.png

    多个分组的富集分析

    示例数据

    data(geneList, package="DOSE") #载入DOSE包中的数据
    head(geneList) #查看数据 包含基因名及其foldchange
    mydf <- data.frame(Entrez=names(geneList), FC=geneList)
    # 以下内容目的是构建分组 也可以用别的分组
    # 将FC大于1的标注为上调 反之为下调
    mydf <- mydf[abs(mydf$FC) > 1,]
    mydf$group <- "upregulated"
    mydf$group[mydf$FC < 0] <- "downregulated"
    # 将FC绝对值大于2 的标注为B 反之为A
    mydf$othergroup <- "A"
    mydf$othergroup[abs(mydf$FC) > 2] <- "B"
    head(mydf) # 查看示例数据(两个分组)
    > head(mydf)
          Entrez       FC       group othergroup
    4312    4312 4.572613 upregulated          B
    8318    8318 4.514594 upregulated          B
    10874  10874 4.418218 upregulated          B
    55143  55143 4.144075 upregulated          B
    55388  55388 3.876258 upregulated          B
    991      991 3.677857 upregulated          B

    分析及其可视化

    # 可以进行单组或多组分析,在 + 号后添加即可
    formula_res <- compareCluster(Entrez~group+othergroup, 
                                  data=mydf, 
                                  fun='enrichKEGG')
    dotplot(formula_res)
    8140aa60b50b9f6a112b7237f786aabf.png
    # 同样可以进行分面操作
    dotplot(formula_res, x=~group) + 
      ggplot2::facet_grid(~othergroup) #对于只用一次该包的功能可以这么写
    23c12dc000e0684be51f66046991c92a.png

    基本用法

    最后附上用法参数

    compareCluster(geneClusters, fun = "enrichGO", data = "", ...)

    参数

    geneClustersentrez基因list. 或者, Entrez~分组 形式的列表
    fun"groupGO", "enrichGO", "enrichKEGG", "enrichDO" or "enrichPathway" .
    data数据集

    References

    Chapter 11 Biological theme comparison | clusterProfiler: universal enrichment tool for functional and comparative study (hiplot.com.cn)

    往期

    R绘图实战|GSEA富集分析图


    1f83b71d01be158d5b6246308a6b3733.png

    展开全文
  • webgestalt:基因富集分析的在线工具

    千次阅读 2019-07-05 19:27:00
    欢迎关注”生信修炼手册”!在组学数据分析中,基因富集分析是最常用的方法之一,所有的基因数据分析最终都要落实到功能上去,富集分析作为一种最基础的功能研究方法,通过go, kegg path...

    欢迎关注”生信修炼手册”!

    在组学数据分析中,基因富集分析是最常用的方法之一,所有的基因数据分析最终都要落实到功能上去,富集分析作为一种最基础的功能研究方法,通过go, kegg pathway等不同的基因功能注释数据库,再结合对应的富集分析算法,可以探究输入的基因富集在哪些功能上。

    富集分析的必要性和重要性不言而喻,有很多的成熟的软件可以来进行这样的分析,比如clusterProfiler, GSEA等等,然而这些工具的使用还是具备一定的门槛,对于没有编程经验的生物学家而言通过这些软件得到富集分析的结果并不是一件容易的事情。

    为了方便广大科研工作者进行富集分析,有很多的在线工具被开发出来,其操作简便,更易上手,最著名的当属DAVID这个网站了,有接近4000次的引用。然而该网站数据更新并不及时,在现在看来,其数据库版本过于老旧,而且不支持一些新出的功能注释数据库。

    webgestalt是一个专注于富集分析的在线网站,支持多种富集分析算法,而且涵盖的功能注释数据库较为全面,在今年5月份刚刚升级了版本,对数据库进行了更新。对应的文章发表在Nucleic Acids Research上,链接如下

    https://academic.oup.com/nar/article/47/W1/W199/5494758

    网址如下

    http://www.webgestalt.org

    支持12个物种,324种基因ID格式,功能注释不仅包括了常见的go,kegg, 还涵盖了蛋白质相互作用,miRNA靶基因,疾病注释,药物靶点等各种注释信息。支持3种富集分析算法

    1. Overrepresentation Enrichment AnalysisORA

    2. Gene Set Enrichment Analysis(GSEA)

    3. Network Topology-based Analysis(NTA)

    官网提供了3种算法的示例,通过示例数据可以快速掌握其用法,无论哪种富集算法,基本上都分以下两个部分

    1. Basic parameters

    基本参数指定物种,富集分析的算法,对应的功能注释数据库,输入的基因列表,背景基因列表等信息,示意如下

    2.   Advanced parameters

    高级参数用于对输出结果的过滤,不同富集算法对应的参数列表也稍有不同,ORA算法的参数示意如下

    设置好对应参数,直接点击submit按钮,提交即可。不同富集算法和数据库,结果展示也不尽相同,但是基本的表格数据, 柱状图,GSEA的富集图片等结果都是有的,几种常见的结果示意如下

    1. 富集分析的表格

    2. 富集分析的柱状图

    3. GSEA富集分析结果图

    4. GO DAG 有向无环图

    webgestalt通过鼠标点击就可以轻松实现各种富集分析,而且数据库更新的也非常及时,如果需要进行富集分析,该网站绝对值得推荐和使用。

    ·end·

    —如果喜欢,快分享给你的朋友们吧—

    扫描关注微信号,更多精彩内容等着你!

    展开全文
  • KEGG基因富集分析

    千次阅读 2019-09-29 15:13:44
    #kegg:基因功能存储在pathway数据库里 rm(list = ls()) ## 魔幻操作,一键清空~ load(file = 'deg.Rdata') head(deg) ## 不同的阈值,筛选到的差异基因数量就不一样,后面的超几何分布检验结果就大相径庭。 ...
    #kegg:基因功能存储在pathway数据库里
    rm(list = ls())  ## 魔幻操作,一键清空~
    
    load(file = 'deg.Rdata')
    
    head(deg)
    
    ## 不同的阈值,筛选到的差异基因数量就不一样,后面的超几何分布检验结果就大相径庭。
    
    logFC_t=1.5
    deg=nrDEG
    
    deg$g=ifelse(deg$P.Value>0.05,'stable',
                 
                 ifelse( deg$logFC > logFC_t,'UP',
                         
                         ifelse( deg$logFC < -logFC_t,'DOWN','stable') )
                 
    )
    
    table(deg$g)
    
    head(deg)
    
    deg$symbol=rownames(deg)
    
    library(ggplot2)
    
    library(clusterProfiler)
    
    library(org.Hs.eg.db)
    
    df <- bitr(unique(deg$symbol), fromType = "SYMBOL",
               
               toType = c( "ENTREZID"),
               
               OrgDb = org.Hs.eg.db)
    
    head(df)
    
    DEG=deg
    
    head(DEG)
    
    #merge函数:将两个数据集合并
    #用于指定依据哪个列合并,常用于当两个数据集公共列名不一样的时候;
    DEG=merge(DEG,df,by.y='SYMBOL',by.x='symbol')
    
    head(DEG)
    #标注好的差异基因
    save(DEG,file = 'anno_DEG.Rdata')
    
    
    
    
    
    gene_up= DEG[DEG$g == 'UP','ENTREZID'] 
    
    gene_down=DEG[DEG$g == 'DOWN','ENTREZID'] 
    
    gene_diff=c(gene_up,gene_down)
    
    gene_all=as.character(DEG[ ,'ENTREZID'] )
    
    data(geneList, package="DOSE")
    
    head(geneList)
    
    boxplot(geneList)
    
    boxplot(DEG$logFC)
    
    
    
    geneList=DEG$logFC
    
    names(geneList)=DEG$ENTREZID
    
    geneList=sort(geneList,decreasing = T)
    
    
    
    
    
    ## KEGG pathway analysis
    
    ### 做KEGG数据集超几何分布检验分析,重点在结果的可视化及生物学意义的理解。
    library(org.Hs.eg.db)
    library("clusterProfiler")
    if(T){
      
      ###   over-representation test 超几何分布检验分析
      #kegg基因富集
      kk.up <- enrichKEGG(gene         = gene_up,
                          
                          organism     = 'hsa',
                          
                          universe     = gene_all,
                          
                          pvalueCutoff = 0.9,
                          
                          qvalueCutoff =0.9)
      
      head(kk.up)[,1:6]
      
      dotplot(kk.up )
      library(ggplot2)
      ggsave('kk.up.dotplot.png')
      #分析下调基因
      kk.down <- enrichKEGG(gene         =  gene_down,
                            
                            organism     = 'hsa',
                            
                            universe     = gene_all,
                            
                            pvalueCutoff = 0.9,
                            
                            qvalueCutoff =0.9)
      
      head(kk.down)[,1:6]
      
      dotplot(kk.down );ggsave('kk.down.dotplot.png')
      
      kk.diff <- enrichKEGG(gene         = gene_diff,
                            
                            organism     = 'hsa',
                            
                            pvalueCutoff = 0.05)
      
      head(kk.diff)[,1:6]
      
      dotplot(kk.diff );ggsave('kk.diff.dotplot.png')
      
    
      kegg_diff_dt <- as.data.frame(kk.diff)
      
      kegg_down_dt <- as.data.frame(kk.down)
      
      kegg_up_dt <- as.data.frame(kk.up)
      
      down_kegg<-kegg_down_dt[kegg_down_dt$pvalue<0.05,]
      down_kegg$group=-1
      
      up_kegg<-kegg_up_dt[kegg_up_dt$pvalue<0.05,]
      up_kegg$group=1
      #调用其他文件中的函数
      source('functions.R')
      
      g_kegg=kegg_plot(up_kegg,down_kegg)
      
      print(g_kegg)
      
      
      
      ggsave(g_kegg,filename = 'kegg_up_down.png')
      
      
      
      ###  GSEA 基因富集
      
      kk_gse <- gseKEGG(geneList     = geneList,
                        
                        organism     = 'hsa',
                        
                        nPerm        = 1000,
                        
                        minGSSize    = 120,
                        
                        pvalueCutoff = 0.9,
                        
                        verbose      = FALSE)
      
      head(kk_gse)[,1:6]
      
      gseaplot(kk_gse, geneSetID = rownames(kk_gse[1,]))
      
      #处理数据,挑选一部分数据
      
      down_kegg<-kk_gse[kk_gse$pvalue<0.05 & kk_gse$enrichmentScore < 0,]
      down_kegg$group=-1
      
      up_kegg<-kk_gse[kk_gse$pvalue<0.05 & kk_gse$enrichmentScore > 0,]
      up_kegg$group=1
      
      
      
      g_kegg=kegg_plot(up_kegg,down_kegg)
      
      print(g_kegg)
      
      ggsave(g_kegg,filename = 'kegg_up_down_gsea.png')
      
      
      
      
      
    }
    
    
    
    ### GO database analysis 
    
    ### 做GO数据集超几何分布检验分析,重点在结果的可视化及生物学意义的理解。
    
    {
      
      
      
      g_list=list(gene_up=gene_up,
                  
                  gene_down=gene_down,
                  
                  gene_diff=gene_diff)
      
      
      
      if(F){
        
        go_enrich_results <- lapply( g_list , function(gene) {
          
            ego <- enrichGO(gene          = gene,
                            
                            universe      = gene_all,
                            
                            OrgDb         = org.Hs.eg.db,
                            
                            ont           = ont ,
                            
                            pAdjustMethod = "BH",
                            
                            pvalueCutoff  = 0.99,
                            
                            qvalueCutoff  = 0.99,
                            
                            readable      = TRUE)
            
            
            
            print( head(ego) )
            
            return(ego)
            
          })
          
        })
        
        save(go_enrich_results,file = 'go_enrich_results.Rdata')
        
        
        
      
        
      
      
      
      
      
      load(file = 'go_enrich_results.Rdata')
      
      
      
      n1= c('gene_up','gene_down','gene_diff')
      
      n2= c('BP','MF','CC') 
      
      for (i in 1:3){
        
        for (j in 1:3){
          
          fn=paste0('dotplot_',n1[i],'_',n2[j],'.png')
          
          cat(paste0(fn,'\n'))
          
          png(fn,res=150,width = 1080)
          
          print( dotplot(go_enrich_results[[i]][[j]] ))
          
          dev.off()
          
        }
        
      }
      
      }
     
    #Step5:GSEA基因富集 
    library(ggplot2)
    
    library(clusterProfiler)
    
    library(org.Hs.eg.db)
    
    
    
    ### 对 MigDB中的全部基因集 做GSEA分析。
    
    # http://www.bio-info-trainee.com/2105.html
    
    # http://www.bio-info-trainee.com/2102.html 
    
    {
      
      load(file = 'anno_DEG.Rdata')
      
      geneList=DEG$logFC
      
      names(geneList)=DEG$symbol
      
      geneList=sort(geneList,decreasing = T)
      
      #选择gmt文件(MigDB中的全部基因集)
      
      d='./GEO-master/MsigDB/symbols'
      
      gmts <- list.files(d,pattern = 'all')
      
      gmts
      
      #GSEA分析
      
      library(GSEABase) # BiocManager::install('GSEABase')
      
      ## 下面使用lapply循环读取每个gmt文件,并且进行GSEA分析
      
      ## 如果存在之前分析后保存的结果文件,就不需要重复进行GSEA分析。
      
      f='gsea_results.Rdata'
      
      if(!file.exists(f)){
        #laaply循环读取,要求输入数据必须是list
        #laaply 高批量处理函数, 遍历列表向量内的每个元素,并且使用指定函数来对其元素进行处理。返回列表向量。
        
        gsea_results <- lapply(gmts, function(gmtfile){
          
          # gmtfile=gmts[2]
          
          geneset <- read.gmt(file.path(d,gmtfile)) 
          
          print(paste0('Now process the ',gmtfile))
          
          egmt <- GSEA(geneList, TERM2GENE=geneset, verbose=FALSE)
          
          head(egmt)
          
          # gseaplot(egmt, geneSetID = rownames(egmt[1,]))
          
          
          
          return(egmt)
          
        })
        
        # 上面的代码耗时,所以保存结果到本地文件
        
        save(gsea_results,file = f)
        
      }
      
      load(file = f)
      
      
      #提取gsea结果,熟悉这个对象
      
      gsea_results_list<- lapply(gsea_results, function(x){
        
        cat(paste(dim(x@result)),'\n')
        
        x@result
        
      })
      
      gsea_results_df <- do.call(rbind, gsea_results_list)
      
      gseaplot(gsea_results[[2]],'KEGG_CELL_CYCLE') 
      
      gseaplot(gsea_results[[2]],'FARMER_BREAST_CANCER_CLUSTER_6') 
      
      gseaplot(gsea_results[[5]],'GO_CONDENSED_CHROMOSOME_OUTER_KINETOCHORE') 
      
      
      
    }
    

     

    展开全文
  • 欢迎关注”生信修炼手册”!metascape是一个web工具,提供了基因富集分析,蛋白质互作网络分析等多种功能,对应的文章发表在nature communications上, 链接如下h...
  • GSEApy:Python中的基因富集分析。 有关使用GSEApy的示例,请单击此处: 发行说明: : 常见问题解答: GSEApy是GSEA和包装器Enrichr Python实现。 GSEApy可用于RNA序列,ChIP序列,微阵列数据。 它可用于...
  • GSEA软件基因富集分析

    千次阅读 2020-02-27 11:29:01
    基因富集分析(GSEA)是一种计算方法,用于确定一组定义好的基因是否在两种生物状态(如表型)之间显示出统计上显著的一致性差异。 分析步骤 首先在官网下载软件:软件下载 1、准备数据 使用GSEA时,可以提供四个...
  • 基因富集分析

    万次阅读 2017-07-26 23:08:31
    通过RNA_seq差异表达分析等获得一组基因,想要进一步了解这些基因可能参与哪些生物学过程,具有哪些功能,一般就会用到基因富集分析了。现在小麦基因注释信息已经可以获得,目前来看包括两套。一个是TGACv1,另一...
  • 传统富集分析(基于超几何分布或者Fisher精确检验):关注一列差异基因是否是随机分布在某一感兴趣的基因集中(某通路的基因)得到通路富集的结果时:(1)、一条通路中既有上调基因又有下调基因,无法确定这条通路总体的...
  • 揭秘差异基因功能富集分析

    万次阅读 2018-11-01 14:26:34
    通过差异分析,我们可以知道不同分组间是否存在差异,存在差异的是哪些基因。再进一步,需要探究这些基因的表达量出现差异是由哪些生物学过程介导的,我们的实验处理影响了哪些生物学过程。 为了探究上述问题,我们...
  • 基因富集分析 GSEA for time-course

    千次阅读 2019-09-17 21:37:44
    基因富集分析(Gene Set Enrichment Analysis,GSEA)是一种针对全基因组表达谱芯片数据的分析方法,将基因与预定义的基因集进行比较。即综合现有的对基因的定位、性质、功能、生物学意义等信息基础,构建一个分子...
  • singleseqgset | 单细胞RNA-Seq基因富集分析NGS系列文章包括NGS基础、转录组分析(Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq...
  • 富集分析是生物信息分析中快速了解目标基因或目标区域功能倾向性的最重要方法之一。其中代表性的计算方式有两种:一是基于筛选的差异基因,采用超几何检验判断上调或下调基因在哪些GO或KEGG或其它...
  • 2004)是一种广泛使用的基因富集分析方法,用于确定已知的生物学功能或过程是否在实验得到的基因列表中被过度表达。 1. 导入包 library(AnnotationHub) #library导入需要使用的数据包 library(org.Hs.eg.db) #...
  • 基因表达分析(中)- 富集分析

    千次阅读 2017-05-30 18:54:03
    首先对基因表达分析(上)做一个简单的回顾 研究基因表达的有如下工具:RNA-Seq,microarray, qRT-PCR等(欢迎补充) RNA-Seq,microarray一般用在探索性阶段,qRT-PCR用于验证 RNA-Seq和microarray由于他们的实验...
  • 功能富集分析 有在线版的: 最主流的就是DAVID,。另外还有Gather,GOrilla,revigo。可以去参考链接里看一下。但是这些有一个很大的缺点是,我们要根据自己的喜好去筛选log2fc 绝对值在2以上的基因,有很大的主观因素...
  • GSEA 基因富集分析

    2019-07-05 15:49:00
    http://software.broadinstitute.org/gsea/index.jsp 转载于:https://www.cnblogs.com/0820LL/p/11138782.html
  • 富集分析基因表达花样可视化

    千次阅读 2019-07-22 09:45:22
    但是要注意该包不能用于执行这些分析,只能把分析结果进行可视化。在所有科学领域,由于空间限制和结果所需的简洁性,切实地去描述事物很难,所以需要将信息进行可视化,使用图片来传达信息。精心设计的图形能在更小...
  • 盖西 用于基因富集分析的R包
  • 富集分析

    千次阅读 2019-11-14 11:19:52
    GO/KEGG Enrichment 这一类富集分析是最简单的富集方法,只关心基因集的富集比例;GSEA类方法更进一层,还关心基因集在打分排序中的分布情况。我们经常使用富集分析的p值以及FDR值,判断是否富集显著。然而对应的...
  • 基因富集分析是指对于给定一组基因根据基因组注释信息(GO、KEGG)对基因进行聚类分析,即给定的基因是不是GO中的一个功能(或KEGG中的一个通路)。 基因的功能富集的目的说明给定的基因集对哪些功能的影响有针对性...
  • 近日,国际知名期刊《核酸研究》(Nucleic Acids Research,IF:16.971)在线发表了北京大学孔雷课题组与中国科学院计算技术研究所赵屹研究员课题组合作开发的基因功能富...
  • fgsea是用于快速预排名基因富集分析(GSEA)的R包。 该软件包可以快速准确地为一组基因集计算任意低的GSEA P值。 P值估算基于自适应多级拆分蒙特卡洛方案。 有关算法的详细信息,请参见。 完整的插图可以在以下...
  • 基因富集

    千次阅读 2019-06-27 17:18:58
    但是后面继续谈到覆盖度不是意味着所有基因组都被覆盖了,而是覆盖率越高,基因组未被检测到的基因越少。根据经验公式,碱基丢失率:P = exp(-C)。假设测序深度10x,基因组长度为20k,那么丢失exp(...
  • 对多个差异表达对比进行参数化的基因富集分析(GSEA)。 当前扩展了的功能。 安装 法 if ( ! requireNamespace( " BiocManager " , quietly = TRUE )) { install.packages( " BiocManager " ) } install....
  • 系列文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据...本期主讲内容——单细胞的maeker基因转化和​富集分析 marker基因转化是为了将基因的id和基.
  • 利用GSEA对基因表达数据做富集分析

    千次阅读 2019-01-12 09:26:00
    用GSEA做富集分析是非常简单的,结果也很详细,并且直接出图;这个软件发表于2005年,一直都在不断更新和增加新的功能;软件基于的数据库 Molecular Signatures Database 也会根据新发表的文章进行完善。 GSEA软件...
  • 1、安装bioconductor及go分析涉及的相关包 source("http://bioconductor.org/biocLite.R") options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/") biocLite("DO.db", type = "source") biocLite(...
  • 基因本体数据库和GO富集分析.ppt
  • 最近总是有需要单独对某一个类型的...使用scipy的stat里面的hypergeom.sf方法进行富集分析的p值计算 hsaxxxxx AA and Linoleic metabolism KEGG pathways Pathways KEGG (Homo sapiens (human)) 59 17 3586 141 3....

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,370
精华内容 948
关键字:

基因富集分析