精华内容
下载资源
问答
  • 富集分析

    千次阅读 2019-11-14 11:19:52
    说到富集分析,做生信的童鞋立刻就会想到GO/KEGG Enrichment、GSEA这两大类方法。但这只是富集分析的两种常见形式,富集分析的概念要更广。GO/KEGG Enrichment 这一类富集分析是最简单的富集方法,只关心基因集的...

    说到富集分析,做生信的童鞋立刻就会想到基于差异基因数目的普通富集分析基于基因排名的GSEA这两大类功能富集分析方法。但这只是富集分析的两种常见形式,富集分析的概念要更广。基于差异基因数目 这一类富集分析是最简单的富集方法,只关心基因集的富集比例,我们一般称为ORA(Over-Representation Analysis,过表达分析);GSEA类方法更进一层,还关心基因集在打分排序中的分布情况,这类方法一般称为FCS(Functional Class Scoring,功能集打分)。我们经常使用富集分析的p值以及FDR值,判断是否富集显著。然而对应的统计量如何计算?富集分析能否在其他情形使用,如何使用?最简单的情形是,如何检验一个biomarker在某个模型中是显著富集的。本文将对此进行解析。

    所谓富集分析,本质上就是对分布的检验,如果分布集中在某一个区域,则认为富集。比如正态分布就是一种富集在均值附近的分布。常用的分布检验方法有卡方检验、Fisher精确检验以及KS检验等方法。ORA类方法用的是离散分布的检验(Fisher精确检验,依据超几何分布的原理),网上有一些资料对此解释(浅探富集分析中的超几何分布),但笔者认为ORA类方法有个问题就是,同一个基因集里相反方向的差异基因该如何处理?首先需要明确的是,不同方向的差异基因应当分开进行富集分析。但是这样相当于把反方向的基因当成中性基因对待,实际上是否应当“抵消”处理呢?笔者倾向于是有必要“抵消校正”的,合理的传统富集分析,应当等价于将logFC值处理成1、0、-1(上调为1,下调为-1,中性为0),然后扔进GSEA;或者说,分布检验的时候,应当是三分布问题,而不是简单的二分布问题。当然也有人构建了补充变量,比如通过计算基因集内上调基因数和下调基因数的差值,构建新的统计量,与ORA的p值结合一起分析(GOplot的z-score)。个人认为,除了上述校正方法以外,还有一个思路就是反方向“稀疏分析”,就是说,一个基因集如果出现某个表型的显著富集,那么同时也要求其在相反表型中出现“显著稀疏”(也就是两个方向分开分析要同时具有显著性)。即使各种补充方法的提出,ORA类方法本身的弊病无法解决,将连续变量转成分类变量进行统计都是下下策(忽略了FC值和p值的连续性),统计效能势必大打折扣,关于ORA类方法,此处不作过多累述。本文重点关注连续分布的富集(GSEA)。

     

    1- 统计学原理

    1.1 Kolmogorov distribution

    独立增量过程,指其增量是相互独立的。以下截图摘自百度百科:

          

    从独立增量过程到Kolmogorov分布,再过渡到KS检验,需进一步补充(有空补充)。

     

    1.2 Kolmogorov–Smirnov test

    Kolmogorov–Smirnov检验(KS检验)的基本介绍,我再偷个懒,引用一个比较喜欢的讲解(Kolmogorov–Smirnov test

          

          

     

    KS检验临界值表:www.cust.edu.tw/mathmet/KS-critical.docx

    KS检验的不错的介绍:KS-检验(Kolmogorov-Smirnov test) -- 检验数据是否符合某种分布

    KS检验的应用:检验数据是否符合某种分布,如正态分布。

    KS检验的优点:作为分布检验的方法(或者说拟合优度检验),该检验不依赖于要测试的累积分布函数,相比于卡方拟合检验(卡方检验需要50个以上的样本),不需要大量的样本。

    KS检验的缺点:只适用于连续分布(只能用于连续或定量数据);在分布中间敏感,在两端不够敏感;最大的局限在于整个分布需要完全确定,如果位置,形状等参数都是从数据中估计的,判定区间不再有效,因此这些参数一般只能通过模拟得到。

    分布检验的比较:R语言 Shapiro-Wilk检验

    不错的资料:

    Kolmogorov-Smirnov Goodness-of-Fit Test

    Kolmogorov-Smirnov检验

    柯尔莫可洛夫-斯米洛夫检验

     

    当数据服从正态分布时,KS检验比 t 检验效能低,但有的时候这种更严格也有好处。KS检验与 t 检验的对比:

          

    因为样本的平均值和标准差非常相似,所以学生T检验最后给出了非常高的P值。KS测试却可以检测出方差。在这个案例中,KS测试发现了红色的分布中一点点的二项分布。

     

    2- KS类富集分析的应用

    GSEA采用了KS检验的思想,但是采用的是加权的近似KS检验方法。

    GSEA的介绍可参考:一文掌握GSEA富集分析-最详细教程, 还比较详细的。注意,GSEA还用了置换检验来评估结果的可靠性。GSEA的数学原理还需要好好读读原论文!比如如何加权,为何最后曲线能回到0值处等等。

    特征在模型中的富集

    可以直接借助GSEA软件计算富集程度,也可以使用原始的KS检验计算。

    比如某个分类指标与模型的关系,可以看看某个类是否富集到模型得分的某一端(以模型得分对样本排序,原假设是该类别在排序后的分布中是均匀分布的)。

    但连续性指标与模型的关系,如何计算富集程度呢?一篇cell的OCLR干性文献里竟然对连续变量也计算量NES,神奇。实际上,任何类型的指标都可以计算NES,只需要事先算出rank即可。

    (本部分待继续完善)

     

    3-基因集打分方法概述

    基因集打分(signature score,geneset score 或 metagene score)、构建功能指数(signature index),是生信分析中常见的分析策略,是一种特殊的建模方法。大致来讲,基因集打分主要分为两大类:基于富集打分、基于权重打分。

    基于富集打分

    基因集内部基因无差别对待,是FCS富集分析的特点之一(指普遍无差别,注意不要和排名的“有差别”混淆理解,因为不同样本的排名顺序不同)。无差别对待有弊有利,优势在于打分建模不容易过拟合(比较稳定),劣势在于建模欠拟合(不同基因的影响力不同,应当有权重)。这类方法包括:ssGSEA、GSVA、combined-zscore、PLAGE等。

    combined-zscore 比较简单,并采取了 t-score排名法逐步构建核心基因子集。这个方法忽略了基因集的“分布”特征,打分比较粗略(可参考:Inferring Pathway Activity toward Precise Disease Classification)。

          

     

    ssGSEA就是将GSEA算法应用于单样本,巧妙而简单。

    GSVA和ssGSEA类似,也是基于KS类随机游走算法,但富集得分统计方式有些区别。

    PLAGE基于SVD,方法比较古老,笔者对此未曾研究。

    基于权重打分

    最大的难点在于,权重如何确定。基因集内的基因表达往往共线性,直接建模来获取权重系数,有些不妥。但也有一些技巧可以使用。比如单变量建模后所得系数构建signature权重矩阵,然后直接建模或相关系数法计算得分;比如直接计算每个基因与基因集之间的相关系数(即平均相关系数),作为权重;比如计算Mutual Information(MI),作为基因间的相关程度,然后迭代计算基因与基因集之间的MI,从而作为权重(可参考:Biomolecular Events in Cancer Revealed by Attractor Metagenes)。

    另外,还有解卷积类的方法也常用来构建权重矩阵(免疫浸润中经常使用这类方法),这部分内容本文不作介绍,可参考:转录组分析中的免疫浸润的评估方法

     

    4-其他富集分析方法

    可以参考这篇文献:Ten Years of Pathway Analysis: Current Approaches and Outstanding Challenges

    或者参考这篇博客解读:功能富集分析概述

          

     

    展开全文
  • GO富集分析

    千次阅读 2018-12-15 16:52:00
    GO的主要用途之一是对基因组进行富集分析。例如,给定一组在特定条件下上调的基因,富集分析将使用该基因组的注释发现哪些GO术语被过度表示(或未充分表示)。  富集分析工具  用户可以直接从GOC网站的主页进行...

      GO的主要用途之一是对基因组进行富集分析。例如,给定一组在特定条件下上调的基因,富集分析将使用该基因组的注释发现哪些GO术语被过度表示(或未充分表示)。

      富集分析工具             

         用户可以直接从GOC网站的主页进行浓缩分析。此服务连接到PANTHER分类系统的分析工具,该分类系统使用GO注释进行最新维护。PANTHER分类系统在Mi H等人,PMID:23868073中有详细说明。支持基因ID的列表可以从PANTHER网站获得。             

       使用GO富集分析工具            

       1.粘贴或键入要分析的基因的名称,每行一个或用逗号分隔。该工具可以处理MOD特异性基因名称和UniProt ID(例如,Rad54或P38086)。             

       2.选择GO方面(分子功能,生物过程,细胞成分)进行分析(生物过程是默认的)。             

       3.选择你的基因来自的物种(默认为智人)。             

       4.按提交按钮。注意,在后面的步骤中,您将能够上传REFERENCE(又称“背景”)列表。             

       5.您将被重定向到PANTHER网站上的结果。这些结果是根据你在步骤3中选择的基因组中所有蛋白质编码基因的集合的富集度得出的。             

      6.(可选但强烈推荐)添加自定义引用列表并重新运行分析。在结果页面顶部的PANTHER分析摘要的“引用列表”行上按“更改”按钮,上传引用列表文件,然后按“启动分析”按钮重新运行分析。参考列表应该是选择较小分析列表的所有基因的列表。例如,在差异表达基因的列表中,参考列表应该只包含在实验中完全

      解释结果表
      结果页面显示一个表,该表列出了重要的共享GO术语(或GO术语的父母),用于描述用户在前一页上输入的一组基因、背景频率、样本频率、预期p值、每个术语过度/低表示的指示以及p值。此外,结果页面显示分析中使用的所有条件。任何未解决的基因名称都将列在表格的顶部。

      背景频率和采样频率
      背景频率是在整个背景集中注释到GO术语的基因数量,而样本频率是在输入列表中注释到GO术语的基因数量。例如,如果输入列表包含10个基因,并且富集了背景集包含6442个基因的酿酒酵母的生物过程,那么如果10个输入基因中有5个被注释为GO术语:DNA修复,那么DNA修复的样本频率将是5/10。然而,如果在所有的酿酒酵母基因组中有100个基因被注释为DNA修复,那么背景频率将是100/6442。
      被高估或被低估
    符号+和-表示一个术语的过度或低度表示。
      P值
      P值是指在注释到特定GO术语的列表中的总n个基因中,考虑到注释到该GO术语的基因在整个基因组中的比例,至少看到x个基因的概率或机会。也就是说,将用户列表中的基因共享的GO术语与注释的背景分布进行比较。p值越接近零,与基因组相关联的特定GO术语就越显著(即,观察到的特定GO术语对一组基因的注释偶然发生的可能性越小)。
      换言之,当搜索过程本体时,如果一个组中的所有基因都与“DNA修复”相关,这个术语将是有意义的。然而,由于基因组中的所有基因(带有GO注释)都间接地与顶级术语“bio._process”相关联,所以如果一个组中的所有基因都与这个非常高水平的术语相关联,那么这并不显著。

     

      外部工具             

       有许多不同的工具可以提供丰富功能。其中一些是基于网络的,另一些可能需要用户下载应用程序或安装本地环境。工具使用的算法不同,执行的统计测试也不同。           

            浓缩工具的一些其他示例包括:

      富集分析小软件---BiNGO。它是Cytoscape软件中很出色的一个插件。它提供的结果中除了文本格式的富集分析结果外,还会将结果以网络图的形式展现,非常美观。

      

      4.1 GO富集分析的结果为“.bgo”结尾的文件,可在设置的输出结果文件夹内用txt打开查看。

     

      x:所分析的基因富集到该GO term中的数量;

      n:基因组中富集到该GO term中的数量;

      X:所分析基因的总数

      N:基因组中基因的总数

      4.2 GO富集分析的层级网络图。每一个圈代表了一个GOterm;颜色是根据富集度即”corrp-value”进行着色的,颜色越深表示富集度越显著;箭头的方向则表示层级关系。

     

     

     

      http://fhqdddddd.blog.163.com/blog/static/186991542010824111830376/

    转载于:https://www.cnblogs.com/wangshicheng/p/10123859.html

    展开全文
  • 五分钟GO、KEGG和COG注释和富集分析

    千次阅读 2021-02-17 11:05:20
    文章目录GeneOntology(GO)数据库简介GO注释原理方式一方式二利用eggnog可视化富集分析原理方式可视化 GeneOntology(GO)数据库简介 GO数据库把生物的生命活动主要分为三个过程: 细胞组分 分子功能 生化过程 主要...

    GeneOntology(GO)数据库简介

    1. GO数据库把生物的生命活动主要分为三个过程:
      细胞组分
      分子功能
      生化过程
    2. 主要针对的是基因(Gene)的产物(RNA或Protein),而不只是gene本身;因为某个gene存在可变剪切,同一个gene有多种表达产物;这个gene 产物有个专有ID即GO term。
    3. GO term之间的关系(Relationship):
      is a
      part of
      has part
      regulates
      occurs in

    GO注释

    原理

    1. 其实现有的很多数据库之间已经实现互相注释,即表示nr-swissport-go-Ko等等之间的ID是一一对应起来的;
    2. 所谓的注释即获得该基因表达产物的GO term ID就行了。

    方式一

    1. 利用blast、diamond等工具将序列比对并获得到nr、swissport等数库中对应的序列ID(gene id或gene symbol等等);
    2. 根据数据库ID对应字典(idmapping.tb.gz)查询获得GO term ID。

    方式二

    1. 利用interproscan等工具注释序列的功能域(Domain)或Motif,并获得对应的GO term ID。

    利用eggnog

    最简单快捷的方式。

    可视化

    利用WEGO

    富集分析

    原理

    常用的富集分析方法有Fisher精准概率法。以GO富集分析为例:
    在单基因分析筛选差异表达基因基础上,Fisher精准概率法利用几何分布(hypergeometric distribution)原理,推断每个基因集中的差异表达基因的比例是否与整个基因集中差异表达基因的***比例***相同。该方法包括两个假设:

    1. 基因是否为差异表达基因(DE)
    2. 基因是否属于GO术语定义的基因集S在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      Fisher’s Exact Test原理:https://www.pathwaycommons.org/guide/primers/statistics/fishers_exact_test/
      Fisher’s Exact Test和卡方检验的区别:
      https://blog.csdn.net/u011955252/article/details/50704459
      富集分析:https://www.jianshu.com/p/3cd3fc14ba16?utm_campaign=haruki&utm_content=note&utm_medium=seo_notes&utm_source=recommendation

    操作

    利用GeneOntology的AmiGO

    展开全文
  • GO富集分析示例

    万次阅读 多人点赞 2019-07-04 10:24:50
    GO是Gene Ontology的简称,是基因功能国际标准分类体系。它旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言...富集分析主要用于差异基因在GO term的富集程度...

    GO是Gene Ontology的简称,是基因功能国际标准分类体系。它旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准。GO分为分子功能(Molecular Function)、生物过程(Biological Process)、和细胞组成(Cellular Component)三个部分。

    富集分析主要用于差异基因在GO term的富集程度,颜色越深富集越显著,红色最显著,黄色次之,无色代表富集不显著。

    • GO term分为三大类,每一类从不同的层面解释基因的生物学功能,我们可以结合生物学问题的特殊性,有针对性的关注GO term:例如我们期望从离子通道这一层面解释植物耐旱,耐盐的的机理,我们可以优先关注细胞组成里面膜蛋白。

    • GO term间具有包含关系,GO term之间可以构建复杂的结构网络。GO term 层级越低,功能描述越具体,越是低层级,越能解释生物学的问题,所以我们要关注显著富集的低层级GO term,以便具体而详尽的解释生物学问题。

    • GO富集分析的统计假设,并不能完全代基因功能的重要程度。要结合生物学问题、结合基因的功能注释,才能判断其中的基因变化是否有重要的生物学意义。

    这里可以使用clusterProfiler找到富集的GO

    安装所需的R包

    source("https://bioconductor.org/biocLite.R")
    options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/")
    biocLite("org.Hs.eg.db")
    biocLite("clusterProfiler")
    install.packages("ggplot2")

    进行富集分析

    library(org.Hs.eg.db)    
    library(ggplot2)    
    setwd("D:/medical_service/go_enrich")    
    # geneNames <- c("AHNAK2", "AQP7", "DNAH11" , "FLG", "HNRNPCL2", "HRNR" , "KMT2C",    
    #               "KMT2D", "MST1L", "MUC12", "MUC16", "MUC17", "MUC19", "MUC3A",     
    #               "MUC4", "MUC5B", "MUC6", "PABPC3", "PDE4DIP", "PLEC" , "TTN",    
    #               "ANKRD36", "FCGBP", "HERC2", "IGFN1", "KRT18", "SLC25A5", "SYNE2",    
    #               "RYR1", "TNS1", "DST", "SYNE1", "TSNARE1", "NBPF19", "NBPF26",    
    #               "PRKCB", "ADGRG1", "OPCML")    
    d1 <- read.table("genenames.txt", header=T, stringsAsFactor =F)    
    geneNames <- d1$GeneName     
    gene <-  mapIds(org.Hs.eg.db, geneNames, 'ENTREZID', 'SYMBOL')    
    BP.params <- enrichGO(   gene   = gene,    
             OrgDb  = org.Hs.eg.db,    
             ont   = "BP"  ,    
             pAdjustMethod = "BH",    
             pvalueCutoff  = 0.01,    
             qvalueCutoff  = 0.05)    
     
    BP.list <- setReadable(BP.params, org.Hs.eg.db, keyType = "ENTREZID")     
      
    dotplot(BP.list, showCategory=30)library(clusterProfiler)
    

    如果要做BP, CC, MF的综合柱状图,采用ggplot2

    p1 <- ggplot(data=goAll)+  geom_bar(aes(x=Description,y=-log10(pvalue), fill=GOType), stat='identity') + coord_flip() + scale_x_discrete(limits=goAll$Description) 
    
    ggsave("out_bar.pdf", p1, width = 10, height=6)
    
    
    p2 <- ggplot(Edata, aes(x=GeneRatio, y=`GO description`)) +
         geom_point(aes( size= Count , colour = -log10( pvalue ))  ) + scale_y_discrete(limits=Edata$`GO description`)+
         ggtitle("GO enrichment")  +  scale_color_gradient(low = 'green', high = 'red') + xlim(range(Edata$GeneRatio)) +
         theme(axis.text.x=element_text(angle=0,size=8, vjust=0.7), axis.text.y=element_text(angle=0,size=6, vjust=0.7),plot.title = element_text(lineheight=.8, face="bold", hjust=0.5, size =16), panel.background = element_rect(fill="white", colour='gray'), panel.grid.major = element_line(size = 0.05, colour = "gray"), panel.grid.minor.y = element_line(size=0.05, colour="gray"), panel.grid.minor.x = element_line(size=0.05, colour="gray")
    )
    
    ggsave("out_GO.pdf", p2, width = 8, height=7)

    效果如图

    WechatIMG4.png

    WechatIMG5.png

     来源:华为云社区  作者:benymorre

    展开全文
  • GSEA富集分析

    2021-05-05 10:53:14
    Gene Set Enrichment Analysis (基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。其输入数据包含两部分,一是已知功能的基因集 (可以是GO注释...
  • 一文掌握GSEA富集分析-最详细教程

    万次阅读 多人点赞 2019-04-26 17:02:46
    之前总结了一篇关于GSEA富集分析的推文——《GSEA富集分析 - 界面操作》,大略介绍了GSEA的定义、GSEA原理、GSEA分析、Leading-edge分析等,不太了解的朋友可以点击阅读先理解下概念。 最近用自己数据实战分析时...
  • 功能富集分析概述

    千次阅读 2019-07-04 10:54:00
    基因功能的富集分析已成为高通量组学数据分析的常规手段,对于揭示生物医学分子机制具有重要意义。关于GO、KEGG、GSEA等等这些词,网上也有很多教程,教大家怎么做GO分析、怎么做GSEA分析等等。但我们不仅要知其然,...
  • KEGG 通路富集分析图解

    千次阅读 2021-01-29 16:20:44
    KEGG 通路富集分析 KEGG数据库 KEGG(京都基因和基因组百科全书)数据库是日本京都大学生物信息学中心的Kanehisa实验室于1995年建立了的生物信息学数据库。现在是基因组测序和其他高通量实验技术产生的大规模分子...
  • 传统富集分析(基于超几何分布或者Fisher精确检验):关注一列差异基因是否是随机分布在某一感兴趣的基因集中(某通路的基因)得到通路富集的结果时:(1)、一条通路中既有上调基因又有下调基因,无法确定这条通路总体的...
  • 富集分析超几何分布

    2020-08-23 00:36:03
    我们在GO,KEGG的富集分析时就采用的是这个模型。 其数学表达式如下: p(k)=P(X=k)=(Mk)∗(N−Mn−k)(Nn) p(k)=P(X=k)=\frac{\binom{M}{k}*\binom{N-M}{n-k}}{\binom{N}{n}} p(k)=P(X=k)=(nN​)(kM​)∗(n−kN−M​)...
  • 揭秘差异基因功能富集分析

    万次阅读 2018-11-01 14:26:34
    通过差异分析,我们可以知道不同分组间是否存在差异,存在差异的是哪些基因。再进一步,需要探究这些基因的表达量出现差异是由哪些生物学过程介导的,我们的实验处理影响了哪些生物学过程。 为了探究上述问题,我们...
  • 结合实验结果和结论,提出了对矿井回风流中的CH4进行富集回收的技术思路,在详尽分析了矿井通风机回风口扩散装置中风流能量转换与守恒定律的时空位置关系基础上,提出构建从矿井总回风中分离富集CH4的技术思想及回收...
  • GSEA富集分析 - 界面操作

    万次阅读 2017-11-17 15:30:47
    欢迎关注微信公众号生信宝典:http://mp.weixin.qq.com/s/3Nd3urhfRGkw-F0LGZrlZQGSEA定义Gene Set Enrichment Analysis (基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布...
  • 富集分析一网打进

    千次阅读 2017-11-17 15:35:38
    富集分析是生物信息分析中快速了解目标基因或目标区域功能倾向性的最重要方法之一。其中代表性的计算方式有两种:一是基于筛选的差异基因,采用超几何检验判断上调或下调基因在哪些GO或KEGG或其它定义的通路富集。...
  • 富集分析是生物信息分析中快速了解目标基因或目标区域功能倾向性的最重要方法之一。其中代表性的计算方式有两种:一是基于筛选的差异基因,采用超几何检验判断上调或下调基因在哪些GO或KEGG或其它...
  • Gene Set Enrichment Analysis (基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。 其输入数据包含两部分: 一是已知功能的基因集 (可以...
  • 浅谈富集分析的Pvalue

    千次阅读 2020-05-02 01:31:28
    浅谈富集分析的Pvalue引言超几何分布Python计算超几何分布 引言 今天给大家带来一个关于“撒币“的问题,说起”撒币“,最经典就是二项分布,也就是你拿起一枚硬币抛向空中,当它转体n个360°,最后华丽的落在地上,...
  • ClueGO能以网络图的形式来展示GO富集结果。 下载ClueGO 1.官网下载 (http://apps.cytoscape.org/apps/cluego) 2.Cytoscape的APP Manager中下载 激活 ClueGO第一次使用还需要按照提示申请license,申请...
  • GSEA定义Gene Set Enrichment Analysis (基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。...
  • 一、基因集功能富集分析(Gene Set Enrichment Analysis) 基因功能富集分析,是指借助各类数据库和分析工具进行统计分析,挖掘在数据库中与我们要研究的生物学问题具有显著相关性的基因功能类别。 For example, ...
  • GSEA-基因集富集分析

    千次阅读 2018-08-29 17:40:00
    基因集富集分析检测基因集合而不是单个基因的表达变化,因此可以包含这些细微的表达变化,预期得到更为理想的结果。 比较GO/KEGG等富集分析: GO/KEGG差异基因的一刀切法——仅关注少数几个显著上调或下调的基因...
  • 7.富集分析(Metascape数据库)“实践是检验真理的唯一标准。”“复现是学习R语言的最好办法。”2021.4.12_1DOI: 10.1016/j.cell.2020.05.032这...
  • 富集分析,词频统计以及词云(Word Cloud)可视化于一体的软件——WocEA软件推荐理由WocEA下载WocEA使用方法可视化本人亲测 推荐理由 经过亲测,实实在在的好用,有本地版和在线版(推荐下载本地版),软件不仅...
  • 我们的云平台上的GO富集分析工具,需要输入的文件表格和参数很简单,但很多同学都不明白其中的原理与结果解读,这个帖子就跟大家详细解释~一、GO富集介绍: Gene Ontology(简称GO)是一个国际标准化的基因功能分类...
  • singleseqgset | 单细胞RNA-Seq基因集富集分析NGS系列文章包括NGS基础、转录组分析(Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq...
  • 生物信息学习的正确姿势NGS系列文章包括NGS基础、高颜值在线绘图和分析、转录组分析(Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析(ChIP-se...
  • R批量做GSEA分析还没有官方的包,但是clusterprofiler可以做,它调用了最新的gfsea包。Gene Set Testing for RNA-seq - fgsea教程 RNA-seq是利器,大部分...普通的转录组套路并不多,差异表达基因、富集分析、WGC...
  • 基于区域熔融原理,通过对水溶液样品冷冻过程中溶质在水和冰两相间转移特征的理论分析,说明区域熔融相当于一种连续萃取过程,并指出分配系数和冷冻体积分数是影响溶质富集效率的主要因素。以菊花提取物为测试样品,...
  • t-SNE 原理分析

    千次阅读 2018-11-25 13:59:22
    t-SNE(t分布随机邻域嵌入)SNE原理分析困惑度对称SNEt-SNE算法过程t-sne for 手写数字 SNE 原理分析 核心:将欧几里得距离转换为条件概率来表达点与点之间的相似度。 假设我们n个高维有数据x1,x2...xnx_1,x_2...x_...
  • GSEA原理的通俗易懂的理解

    千次阅读 2020-07-01 15:13:59
    我们先提出问题:在解读传统的富集分析(基于超几何分布或Fisher检验)结果时,经富集分析筛选的功能通路中,既有上调差异基因,也有下调差异基因,那么这条通路总体的表现形式改如何定义(是被抑制还是激活)?...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 839
精华内容 335
关键字:

富集分析原理