精华内容
下载资源
问答
  • Beta多样性

    千次阅读 2020-07-19 09:21:01
    在生物群落的研究中,经常会使用物种群落间的距离来评估样本间物种群落的差异程度,这种群落间的距离就是beta多样性。 用来评估物种群落距离的beta多样性指数有很多种,其中最常用的是Bray-Crutis距离和Unifrac距离...

    在生物群落的研究中,经常会使用物种群落间的距离来评估样本间物种群落的差异程度,这种群落间的距离就是beta多样性。

    用来评估物种群落距离的beta多样性指数有很多种,其中最常用的是Bray-Crutis距离和Unifrac距离。

    Bray-Crutis距离

    Bray-Crutis距离在计算是同时考虑了物种在群落中是否存在以及物种在群落中的丰度,可以参考alpha多样性指数中的Shannon指数进行理解。

    Bray-Crutis距离的计算结果在0-1之间,0代表两个样本的微生物群落没有任何差异,数值越接近1,两个样本微生物群落之间的差异越大。

    Bray-Crutis距离计算
    R语言vegan包中的vegidst()函数可以很方便的计算多种beta多样性距离。

    用于计算Bray-Crutis距离的输入文件为抽平后各样品OTU的丰度表格。

    library(vegan)
    bray <- vegdist(otu,method = "bray")
    

    计算得到的距离文件为dist类型,需要将其转换为矩阵,才能将其保存到本地并进行下一步绘图。

    bray <- as.matrix(bray)
    write.table(bray,"bray-crutis.txt",sep = "\t")
    

    聚类热图绘制
    我们使用pheatmap包根据计算的结果绘制一个聚类热图。

    library(pheatmap)
    library(RColorBrewer)
    pheatmap(bray,color = colorRampPalette(brewer.pal(7,"RdYlBu"))(100))
    

    Unifrac距离

    Unifrac距离可以简单的理解为在普通beta多样性距离的基础上引入了OTU的进化距离。

    Unifrac距离分为加权和不加权两种,Unweighted Unifrac在计算时只考虑物种在样本中是否存在,Weighted Unifrac在计算时同时考虑物种的存在及其丰度,类似于alpha多样性指数中的丰度度和多样性的区别。

    可以使用phyloseq包计算Unifrac距离,phyloseq是集成在Bioconductor中的,第一次安装需要同时安装大量的依赖包。

    if (!requireNamespace("BiocManager", quietly = TRUE))
      install.packages("BiocManager")
    BiocManager::install("phyloseq")
    

    因为引入了OTU的进化距离,因此输入文件除了OTU的表格之外,还需要OTU代表序列的系统发育树。

    这个可以使用QIIME分析自动生成的,也可以使用OTU的代表序列使用MEGA等软件自行绘制。

    library(phyloseq)
    library(GUniFrac)
    tree <- read.tree("OTUs.tre")
    unifrac <- phyloseq(otu_table(otu,taxa_are_rows = F),phy_tree(tree))
    #加权Unifrac
    W.unifrac <- distance(unifrac,method = "wunifrac")
    #非加权Unifrac
    U.unifrac <- distance(unifrac,method = "unifrac")
    

    由于使用的是无根树,因此运行会提示Warning message,无需理会,会正常输出结果。

    W.unifrac <- as.matrix(W.unifrac)
    write.table(W.unifrac,"W.unifrac.txt",sep = "\t")
    U.unifrac <- as.matrix(U.unifrac)
    write.table(U.unifrac,"U.unifrac.txt",sep = "\t")
    

    结果的保存方式与Bray-Crutis距离一致。

    聚类热图绘制
    因为Unifrac距离的结果同时包含加权和非加权两种,因而聚类热图如果还是按照Bray-Crutis距离的方式进行绘制就没什么新意了,这里的最终目的是在一幅图中同时展示加权和非加权的距离及其聚类模式。

    经过思考之后打算使用corrplot包按照绘制相关性图的方式绘制Unifrac聚类热图.

    首先须需要对计算得到的距离矩阵进行处理,使得矩阵的上三角为加权Unifrac,下三角为非加权Unifrac。

    
    Unifrac <- W.unifrac
    Unifrac[lower.tri(Unifrac)] <- U.unifrac[lower.tri(U.unifrac)]
    

    接着我先绘制了一个简单的热图。

    library(corrplot)
    corrplot(Unifrac,method = "color",p.mat = Unifrac,insig = "p-value",sig.level = -1,cl.lim = c(0,1),
             col = colorRampPalette(c("Red","white","navy"))(100),tl.col = "black")
    

    这幅图中只是分别在上三角和下三角展示了样品间的距离,并且标出了距离的具体数值,但是并没有进行聚类,虽然corrplot自身带有聚类功能,但是距离是按照整行和整列进行聚类,并无法对上下三角的数据进行分别聚类。

    由于绘制一张热图横纵坐标对应样本的位置是只能有一种排列方式,虽然可以使用上下三角展示两种距离,但是无法在一张图中同时展示两种聚类方式。

    想到了一种方法,就是分别画出上三角和下三角两幅图,之后在拼在一起。

    可是遇到了不可抗力,暂时无法解决。

    如果依然使用corrplot或者其它的热图绘制方法,是很容易得到两个带有不同聚类的上三角和下三角图像的,但是两个三角形图的要怎么能用R拼在一起呢?

    用base plot的方式也能够得到两个三角形的图,也能够拼在一起,但是无法自动根据样品聚类模式调整各样本的位置,理论上倒是能解决这个问题,但是工程有点大啊,相当于写一个专门的R包来干这个事,性价比极低。

    还有一种快捷的方式,就是输出两个png格式的带有聚类的上下三角图,之后用PS拼在一起,再手动修整样本名称和图例位置

    展开全文
  • beta多样性计算

    千次阅读 2020-08-26 19:53:25
    file=c("salmonRNA.csv","salmonDNA.csv") for (j in file) { c<-read.csv(j,row.names=1,stringsAsFactors=FALSE) vegan::vegdist(t(c),method="bray") %>% ape::pcoa()->pcoa tmp<...

    file=c("salmonRNA.csv","salmonDNA.csv")
    for (j in file)
    {
      c<-read.csv(j,row.names=1,stringsAsFactors=FALSE)
      vegan::vegdist(t(c),method="bray") %>% ape::pcoa()->pcoa
      tmp<-if (is.null( pcoa$values$Rel_corr_eig))
        pcoa$values$Relative_eig else pcoa$values$Rel_corr_eig
      write.csv(tmp,file=paste(j,"Axexp.csv"))
      write.csv(pcoa$vectors,file=paste(j,"Ax.csv"))
    }

    展开全文
  • 物种多样性学习之Beta多样性

    千次阅读 2018-08-03 17:47:20
    Beta多样性: 定义为沿着环境梯度的变化物种替代的程度。不同群落或某些环境梯度上的不同点之间的共有种越少,Beta多样性就越大。(Beta多样性度量时空尺度上物种组成的变化,是生物多样性的重要组成部分,) 意义: ...

    Beta多样性: 定义为沿着环境梯度的变化物种替代的程度。不同群落或某些环境梯度上的不同点之间的共有种越少,Beta多样性就越大。(Beta多样性度量时空尺度上物种组成的变化, 是生物多样性的重要组成部分,)

    意义:

    ①指示生境被物种隔离的程度;

    ②Beta多样性的测定值可以用来比较不同地段的生境多样性;

    ③Beta 多样性与Alpha 多样性一起构成了总体多样性或一定地段的生物异质性

    beta多样性侧重于不同生境的群落构成的比较

    原始定义是沿环境梯度上或者环境类型上物种的取代或者生物改变程度有一定分歧的扩展的定义是我们可以把任何对组成型变异的度量都可以看作是对β多样性的度量。( 不同样本间的物种差异。)

    beta多样性的分析方法有:PCA、PCoA、Anosim、NMDS

     

    展开全文
  • Beta 多样性排序分析方法与比较

    千次阅读 2019-08-14 09:48:37
    β 多样性是不同生态系统之间多样性的比较,是物种组成沿环境梯度或者群落间的变化率,用来表示物种种类对环境异质性的反应。一般来说,包括物种改变(多少)和物种产生(有无)两部分。 意义 衡量不同因素下的样本...

    定义

    β 多样性是不同生态系统之间多样性的比较,是物种组成沿环境梯度或者群落间的变化率,用来表示物种种类对环境异质性的反应。一般来说,包括物种改变(多少)和物种产生(有无)两部分。

    意义

    衡量不同因素下的样本多样性变化程度,从而辅助找出影响微生物群落变化的因素。

    特征分析法

    直角坐标、特征值
    特征分析最大好处就是用最少(最重要)的坐标轴(特征值)展示(还原)最多的变量位置(数据距离)
    PCA与CA是特征分析,NMDS不是特征分析

    PCA

    • Principle Component Analysis
    • 主成分分析
    • 其中一种最古老的的排序分析方法,慢慢被淘汰
    • 利用直角坐标,同时把物种和样本排序信息展示在同一个分析当中(biplot)
    • 表征分析,把变量作用最大化
      在这里插入图片描述
      在这里插入图片描述

    PCA 的重要假设(限制)

    • 根据欧式距离计算
      导致默认某些OTU的数量变化比OTU的种类变化更重要,实际上生态数据中存在很多低丰度的OTU,因此造成较大误差,实际上可以采用PCoA,CA来进行分析。
    • 数据可以通过线性直角坐标展示
      物种数量与环境因素存在线性关系,但实际数据分析可能产生Horeshose effect(马蹄效应,很多微生物数量的变化在环境变量中都呈单峰模型,而PCA是线性模型,所以会出现马蹄效应)

    CA 分析

    • Correspondence Analysis
    • 对应分析
    • 与PCA不同的是CA分析更多考虑总体物种影响因素,是非线性模型(单峰模型)
    • PCA中,物种在箭头持续增加,而CA,物种采取加权平均值策略

    CA 延伸

    • CA分析在物种多样性高的时候,容易出现arch effect ,因此需要其他模型:
      • DCA (Detrending correspondence analysis)CA分析变种,消除CA的arch effect
      • CCA 单峰模型,增加环境因素的CA分析
        在这里插入图片描述

    距离分析法

    • 没有特征物种,利用样本间距离进行分析
    • PCoA,NMDS

    微生物样本的距离

    • 欧式距离
    • Jaccard
    • Bray-Curtis
    • Unifrac
      在这里插入图片描述

    PCoA

    • Principal Corrdinates Analysis
    • 主坐标分析
    • 利用距离数据,对样本的距离在低维度进行欧几里得距离展示,同时以最大限度地保留原始样本的距离(如果利用原始数据欧式距离,本质上是PCA)
    • 相比于PCA,因为以样本距离为整体考虑,更符合生态学数据特征
    • CA分析是原始数据为基础,PCoA是距离数据为基础,受距离算法影响大
      在这里插入图片描述

    PCoA 影响因素

    • 不同距离的选择
    • 数据输入是相似性距离,输出线性距离关系。展示最能够保持样本间原来相似性距离的坐标
    • 线性分析可能会让实际数据结果产生Arch effect–NMDS可消除

    NMDS

    • Non-metric multidimensional scaling
    • 非度量多维度分析法
      在这里插入图片描述
    • 当样本距离关系不是特别准确的时候,并不能发掘最佳坐标,样本映射位置难以确定,先假设最佳维度
    • 抽样误差,Beta多样性特别高
    • 强调排名,不是实际距离数值进行分析
    • 结果并不唯一
    • 运行成本高

    NMDS原理-作图

    • 预先构建维度
    • 根据设定维度,随机放置距离数据
    • 根据设定距离数据与原始数据比较,判断模型适合程度(Stress判断)
    • 根据第一次的数据分析,重新小范围打乱数据,在进行多次stress计算,知道稳定
    • 最终找出最适合是模型(最小stress)

    NMDS 图形解读

    • 第一位坐标轴不一定比第二维坐标轴重要
    • 放置距离与原始距离并不一致(因为根据排名输入)
    • 模型判断,一般stress低于0.1为合理,低于0.05,相似性非常好

    NMDS缺点

    • 相比于表征分析,NMDS更在于排名,因此对数据的解读能力往往不足,往往弱化了主效因素
    • 一般上,stress数值会随数据量的增大而减少,因此在大样本分析时候,stress数据往往异常的小

    各种方法比较

    在这里插入图片描述

    展开全文
  • 使用QIIME进行 进化树,Alpha,Beta多样性 分析 上回讲到,使用Usearch进行进化树,Alpha,Beta多样性的分析。同时,我们还要再次强调QIIME的伟大之处在于全流程分析的能力。因此,使用QIIME同样可以进行上述分析过程...
  • 221.Beta多样性PCoA和NMDS排序

    万次阅读 多人点赞 2020-06-29 07:00:00
    Beta多样性与PCoA和NMDS排序本节作者:文涛,刘永鑫版本1.0.4,更新日期:2020年6月27日本项目永久地址:https://github.com/YongxinLiu/Mi...
  • 在基于高通量测序的微生物群落分析中,若提到如何描述不同群落β多样性是否存在差异或者评估组内或组间的差异程度,我们通常可以想到很多方法,这些都是描述群落β多样性特征的常见分析。例如,一般我们首先会基于...
  • 在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CPCoA/CCA/RDA)。 Beta多样性 Beat多样性是生态学概念,专指...
  • 《扩增子分析解读》系列文章介绍扩增子分析是目前宏基因组研究中最常用的技术,由于微生物组受环境影响大,实验间重复较差,更需要更多的实验重复和分析技术来保证结果的准确、可重复。本系统文章叫分析解读,即...
  • 扩增子统计绘图2散点图:Beta多样性

    千次阅读 2017-08-21 20:37:56
    2散点图:Beta多样性,组间整体差异分析 图中WT和OE在第一轴明显分开的,但WT与KO间区分不明显,是否存在显著差别呢。 我们以WT和OE为例,统计组间是否存在显著差异。 # 统计WT与KO间是否有差异显著 # ...
  • 222Beta多样性限制性排序CPCoA/CCA/RDA/LDA本节作者:文涛,南京农业大学;刘永鑫,中科院遗传发育所版本1.0.5,更新日期:2020年8月12日本项目永久地址:htt...
  • R语言计算生物多样性指数

    千次阅读 2020-03-10 16:49:24
    R语言计算生物多样性指数 计算生物多样性 rm(list = ls()) setwd("D:/R Working Directory") getwd() library(readxl) library(vegan) library(reshape2) fyzw <- read_excel("C:/Users/Administrator/Desktop/...
  • 阐述微生物组的Beta多样性:从全局比对到局部比对Elucidating the Beta-Diversity of the Microbiome: from Global Alignme...
  • 222Beta多样性限制性排序CPCoA/CCA/RDA/LDA 本节作者:文涛,南京农业大学;刘永鑫,中科院遗传发育所 版本1.0.5,更新日期:2020年8月12日 本项目永久地址:https://github.com/YongxinLiu/MicrobiomeStatPlot ,...
  • R语言量化:alpha值和beta值中我们介绍了beta和alpha的含义和计算方法。beta除了可以用于资产定价,在二级市场中也有着广泛的用途,例如可以用来判断股以及构建投资策略。一、beta与“股” 所谓股,指的是...
  • 微生物生态:从phyloseq对象输出β多样性箱线图 有些时候,β多样性的比较都是用排序的方法实现,但也可以换换口味,用箱线图比较,比如这样: 这时候,需要利用Bray-Curtis,或者其他类型的距离矩阵,分组统计。...
  • R语言量化:alpha值和beta

    万次阅读 2018-02-19 15:03:03
    量化投资中经常提到的alpha(收益)和beta(收益)是从资本资产定价模型(CAPM)中衍生出来的概念。CAPM是一个给风险定价的基本模型,它认为只有系统风险(Systematic risk)才能带来收益。这是因为非系统风险...
  • Alpha多样性

    千次阅读 2020-07-18 22:53:17
    Alpha多样性用于分析样品内(Within-community)的微生物群落多样性,可以反映样品内的微生物群落的丰富度和多样性。 alpha多样性指数包括丰富度、多样性、均一性等。 丰富度指数只是简单的估算群落中物种的数量,而不...
  • β多样性算法

    千次阅读 2018-05-06 14:16:23
    利用列联表分析的方法得到一个卡方统计量来衡量两个体之间的差异。 卡方统计量越大, 表明个体的选择对变量的取值有显著影响, 这也意味着两个体 之间的差异越大。 稀有物种会对距离产生明显影响, 应先剔除稀有...
  • 群落生态学的 α-、β-、γ-多样性

    千次阅读 2018-12-30 00:00:00
    据此,生态学家开发了多种多样的度量指标,比如本文将要介绍的α-多样性、β-多样性、和γ-多样性。(备注:位于伦敦的英国皇家植物园--邱园,是世界上最富盛名的植物园和植物分类学研究中心之一,始建于1759年。感...
  • 菌群多样性分析报告

    千次阅读 2019-03-16 23:01:32
    在开始实验项目之前,明确...下面给出菌群多样性分析报告中应包含的大致内容,并对实验流程做出指导性的阐述。 1.项目背景与概况 简单阐述所研究项目的国内外现状,本项目的目的与意义。 2.材料与方法(materi...
  • 实际上,Baselga还构建了计算这两个组分的方法,并提供了相应的R语言包,betapart。解析二者的相对重要性还是有意义的,可以更详细地理解和认识观测β多样性(observed β diversity)究竟是什么过程引起的。 图9. ...
  • 多模态和跨模态的文章博主在之前的都整理过了,最近对多样性比较感兴趣,但是发现做这个方向的人确实太少了(虽然在推荐里面做的人还是挺多的)。暂时把目前看到觉得还不错的文章整理一下。 Diversity 在推荐系统的...
  • 产品结构设置 典型分析结果展示 指数组间差异检验分析 指数组间差异检验分析通过比较不同组间指数的差异显著性,进而评估不同组间微生物群落的丰度和多样性差异。每条柱子代表一个分组。两组样本比较结果(左图),...
  • Alpha多样性与箱线图 本节作者 刘永鑫 中科院遗传发育所 文涛 南京农业大学 钱旭波 浙江大学 版本1.0,更新日期:2020年6月7日 Alpha多样性概念和常用指数 物种多样性主要从三个层面进行衡量,分别是α多样性、β...
  • 文章亮点:【1】 微生物稀有物种(Rare species)比普通物种(Common species)对全球变化因子更敏感【2】土壤pH可以解释全球变化因子引起的微生物alpha多样性的...
  • 在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CPCoA/CCA/RDA)。 Beta多样性 Beat多样性是生态学概念,专指不同组...
  • 但为我们还需要进一步的统计,以及为了实现可重复式计算,建议所有统计绘图全部在R语言中用代码记录,便于将来修改和检查错误,发表文章同时共享代码也是对成果的负责。 R ggplot2绘制稀释曲线 1. 按每个...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,205
精华内容 882
关键字:

beta多样性r