精华内容
下载资源
问答
  • Beta多样性

    千次阅读 2020-07-19 09:21:01
    在生物群落的研究中,经常会使用物种群落间的距离来评估样本间物种群落的差异程度,这种群落间的距离就是beta多样性。 用来评估物种群落距离的beta多样性指数有很多种,其中最常用的是Bray-Crutis距离和Unifrac距离...

    在生物群落的研究中,经常会使用物种群落间的距离来评估样本间物种群落的差异程度,这种群落间的距离就是beta多样性。

    用来评估物种群落距离的beta多样性指数有很多种,其中最常用的是Bray-Crutis距离和Unifrac距离。

    Bray-Crutis距离

    Bray-Crutis距离在计算是同时考虑了物种在群落中是否存在以及物种在群落中的丰度,可以参考alpha多样性指数中的Shannon指数进行理解。

    Bray-Crutis距离的计算结果在0-1之间,0代表两个样本的微生物群落没有任何差异,数值越接近1,两个样本微生物群落之间的差异越大。

    Bray-Crutis距离计算
    R语言vegan包中的vegidst()函数可以很方便的计算多种beta多样性距离。

    用于计算Bray-Crutis距离的输入文件为抽平后各样品OTU的丰度表格。

    library(vegan)
    bray <- vegdist(otu,method = "bray")
    

    计算得到的距离文件为dist类型,需要将其转换为矩阵,才能将其保存到本地并进行下一步绘图。

    bray <- as.matrix(bray)
    write.table(bray,"bray-crutis.txt",sep = "\t")
    

    聚类热图绘制
    我们使用pheatmap包根据计算的结果绘制一个聚类热图。

    library(pheatmap)
    library(RColorBrewer)
    pheatmap(bray,color = colorRampPalette(brewer.pal(7,"RdYlBu"))(100))
    

    Unifrac距离

    Unifrac距离可以简单的理解为在普通beta多样性距离的基础上引入了OTU的进化距离。

    Unifrac距离分为加权和不加权两种,Unweighted Unifrac在计算时只考虑物种在样本中是否存在,Weighted Unifrac在计算时同时考虑物种的存在及其丰度,类似于alpha多样性指数中的丰度度和多样性的区别。

    可以使用phyloseq包计算Unifrac距离,phyloseq是集成在Bioconductor中的,第一次安装需要同时安装大量的依赖包。

    if (!requireNamespace("BiocManager", quietly = TRUE))
      install.packages("BiocManager")
    BiocManager::install("phyloseq")
    

    因为引入了OTU的进化距离,因此输入文件除了OTU的表格之外,还需要OTU代表序列的系统发育树。

    这个可以使用QIIME分析自动生成的,也可以使用OTU的代表序列使用MEGA等软件自行绘制。

    library(phyloseq)
    library(GUniFrac)
    tree <- read.tree("OTUs.tre")
    unifrac <- phyloseq(otu_table(otu,taxa_are_rows = F),phy_tree(tree))
    #加权Unifrac
    W.unifrac <- distance(unifrac,method = "wunifrac")
    #非加权Unifrac
    U.unifrac <- distance(unifrac,method = "unifrac")
    

    由于使用的是无根树,因此运行会提示Warning message,无需理会,会正常输出结果。

    W.unifrac <- as.matrix(W.unifrac)
    write.table(W.unifrac,"W.unifrac.txt",sep = "\t")
    U.unifrac <- as.matrix(U.unifrac)
    write.table(U.unifrac,"U.unifrac.txt",sep = "\t")
    

    结果的保存方式与Bray-Crutis距离一致。

    聚类热图绘制
    因为Unifrac距离的结果同时包含加权和非加权两种,因而聚类热图如果还是按照Bray-Crutis距离的方式进行绘制就没什么新意了,这里的最终目的是在一幅图中同时展示加权和非加权的距离及其聚类模式。

    经过思考之后打算使用corrplot包按照绘制相关性图的方式绘制Unifrac聚类热图.

    首先须需要对计算得到的距离矩阵进行处理,使得矩阵的上三角为加权Unifrac,下三角为非加权Unifrac。

    
    Unifrac <- W.unifrac
    Unifrac[lower.tri(Unifrac)] <- U.unifrac[lower.tri(U.unifrac)]
    

    接着我先绘制了一个简单的热图。

    library(corrplot)
    corrplot(Unifrac,method = "color",p.mat = Unifrac,insig = "p-value",sig.level = -1,cl.lim = c(0,1),
             col = colorRampPalette(c("Red","white","navy"))(100),tl.col = "black")
    

    这幅图中只是分别在上三角和下三角展示了样品间的距离,并且标出了距离的具体数值,但是并没有进行聚类,虽然corrplot自身带有聚类功能,但是距离是按照整行和整列进行聚类,并无法对上下三角的数据进行分别聚类。

    由于绘制一张热图横纵坐标对应样本的位置是只能有一种排列方式,虽然可以使用上下三角展示两种距离,但是无法在一张图中同时展示两种聚类方式。

    想到了一种方法,就是分别画出上三角和下三角两幅图,之后在拼在一起。

    可是遇到了不可抗力,暂时无法解决。

    如果依然使用corrplot或者其它的热图绘制方法,是很容易得到两个带有不同聚类的上三角和下三角图像的,但是两个三角形图的要怎么能用R拼在一起呢?

    用base plot的方式也能够得到两个三角形的图,也能够拼在一起,但是无法自动根据样品聚类模式调整各样本的位置,理论上倒是能解决这个问题,但是工程有点大啊,相当于写一个专门的R包来干这个事,性价比极低。

    还有一种快捷的方式,就是输出两个png格式的带有聚类的上下三角图,之后用PS拼在一起,再手动修整样本名称和图例位置

    展开全文
  • 物种多样性学习之Beta多样性

    千次阅读 2018-08-03 17:47:20
    Beta多样性: 定义为沿着环境梯度的变化物种替代的程度。不同群落或某些环境梯度上的不同点之间的共有种越少,Beta多样性就越大。(Beta多样性度量时空尺度上物种组成的变化,是生物多样性的重要组成部分,) 意义: ...

    Beta多样性: 定义为沿着环境梯度的变化物种替代的程度。不同群落或某些环境梯度上的不同点之间的共有种越少,Beta多样性就越大。(Beta多样性度量时空尺度上物种组成的变化, 是生物多样性的重要组成部分,)

    意义:

    ①指示生境被物种隔离的程度;

    ②Beta多样性的测定值可以用来比较不同地段的生境多样性;

    ③Beta 多样性与Alpha 多样性一起构成了总体多样性或一定地段的生物异质性

    beta多样性侧重于不同生境的群落构成的比较

    原始定义是沿环境梯度上或者环境类型上物种的取代或者生物改变程度有一定分歧的扩展的定义是我们可以把任何对组成型变异的度量都可以看作是对β多样性的度量。( 不同样本间的物种差异。)

    beta多样性的分析方法有:PCA、PCoA、Anosim、NMDS

     

    展开全文
  • Beta多样性
  • 221.Beta多样性PCoA和NMDS排序

    千次阅读 多人点赞 2020-06-29 07:00:00
    Beta多样性与PCoA和NMDS排序本节作者:文涛,刘永鑫版本1.0.4,更新日期:2020年6月27日本项目永久地址:https://github.com/YongxinLiu/Mi...

    Beta多样性与PCoA和NMDS排序

    本节作者:文涛,刘永鑫

    版本1.0.4,更新日期:2020年6月27日

    本项目永久地址:https://github.com/YongxinLiu/MicrobiomeStatPlot ,本节目录 221BetaPCoA,包含R markdown(*.Rmd)、Word(*.docx)文档、测试数据和结果图表,欢迎广大同行帮忙审核校对、并提修改意见。提交反馈的三种方式:1. 公众号文章下方留言;2. 下载Word文档使用审阅模式修改和批注后,发送至微信(meta-genomics)或邮件(metagenome@126.com);3. 在Github中的Rmd文档直接修改并提交Issue。审稿人请在创作者登记表 https://www.kdocs.cn/l/c7CGfv9Xc 中记录个人信息、时间和贡献,以免专著发表时遗漏。

    作为高通量测序的代表之一,扩增子目早已成为表征微生物群落的最主流手段,在后续的数据处理,生物信息学分析中最基础也是最重要的分析就是群落多样性分析(alpha多样性和beta多样性)。今天我们来学习的就是群落bate多样性分析中最重要的-非限制性排序分析。

    基本概念

    β多样性(Beta diversity)

    β多样性又称生境间的多样性(between-habitat diversity),是指沿环境梯度不同生境群落之间物种组成的相异性或物种沿环境梯度的更替速率,用于研究群落之间的种多度关系,例如:物种更替或物种组成的差异。

    群落的Beta多样性分析包括非限制性排序(如PCoA,NMDS等)、层次聚类、限制性排序等,且均以群落相似或距离为基础计算。

    非限制性排序和层次聚类并是不独立的,下面这张图表示的就是非限制性排序和层次聚类的关系:

    图1. 排序与聚类的关系。a. 距离矩阵,b. 聚类结果,c. 排序结果,d. 聚类结果叠加排序结果。图片来源 http://mb3is.megx.net/gustame/home

    将聚类分析的结果与诸如非度量多维尺度分析(Non-metric multidimensional scaling, NMDS)产生的排序之类的结果结合,在图中,聚类和NMDS结果叠加在左下方面板中。在此示例中,结果展现出现一致性:聚集在一起的对象也彼此接近。

    相似性和距离

    生态相似性(Ecological resemblance)以计算不同样本群落组成相似程度或距离(相异程度)为基础,是处理多元生态数据的基本方法之一。在群落数据的分析中,常用其反映Beta多样性。

    如在物种数据的分析中,对于两个群落,若它们共享相同的物种,并且所有物种的丰度也一致,那么这两个群落就具有最高的相似程度(或最低距离0)。生态学数据分析中的很多统计方法都以样方之间的相似性或距离为基础,例如上述提到的Beta多样性分析中的聚类、排序等,即使对于PCA实质上在计算时基于欧几里得(euclidean)距离考虑的。

    若两个对象在各属性上越近似,那么它们的相似性就越高。对于群落数据,这些属性一般就是物种组成,或者环境属性等。通常使用物种组成数据,依据相似性指数(similarity indices)判断群落相似性,范围由0(两个群落不共享任何物种)到1(两个群落的物种类型和丰度完全一致)。所有相似性指数均可以转换为距离指数,转化公式为“距离指数 = 1 – 相似性指数”的关系。

    (1)可以转化为相似性指数的距离指数,例如定量数据的相异百分率(也称为Bray-Curtis距离)等。二者相互转换的公式通常表示为D=1-S或S=1-D,其中S是相似性指数,D为距离指数。

    (2)无法转化为相似性指数的距离指数,例如欧几里得距离、卡方距离。

    距离指数(distance indices)或称距离测度(distance measures),与相似性指数相反,距离数值越大表明群落间差异越大。存在多种距离类型,例如欧几里得(Euclidean)距离、Bray-Curtis距离、UniFrac距离等。对于物种组成数据,距离指数的最小值为0(两个群落的物种类型和丰度完全一致),最大取值取决于距离类型和数据本身。

    相似性或距离的衡量标准有很多种,Legendre于1998编写的“Numerical Ecology”一书中的“Ecological resemblance”章节内容列出大约30种方法,

    常见的相似性/距离指数

    Jaccard:

    Jaccard相似性指数(Jaccard similarity index)将两个样方共享的物种数量(a)除以两个样方中出现的所有物种的总和(a + b + c,其中b和c是仅在第一个和第二个样方中出现的物种数量)。计算公式如下:

    其中,y1j和y2j分别是对象1和2中元素j的数值。若是群落物种数据,那么y1j和y2j即分别是样方1和2中物种j的丰度。p是物种数(样方-物种矩阵中的物种数)

    Bray-curtis距离(Bray-curtis distance):

    Bray-curtis距离(Bray-curtis dissimilarity)其计算公式如下:

    欧几里得距离(Euclidean distance):

    欧几里得距离是多变量分析中经常使用的一种距离,如在线性排序方法PCoA、CCA。计算公式如下:

    其中p是物种数(样方-物种矩阵中的物种数),y1j和y2j表示两个样方中对应的物种多度。

    但是在物种数据的分析中,欧几里得距离却表现不佳。因为它将“双零”现象视作相同存在的方式处理,会缩小两个共享很少物种的群落之间的距离。双零”是指在计算群落相似性(或距离)时,所比较的两个样方中缺失某些物种的情况。具体在群落中一个物种在两个样方内同时缺失,并不能成为这两个样方具有组成相似的依据,因为引起缺失的原因可能完全不同,其次在物种矩阵内,不可解释的双零的数量取决于物种的数量,因此也会随着检测到的稀有种数量的增加而显著增加。

    若在群落距离计算过程中使用欧几里得距离,可以先对原始物种数据进行数据转化(常见的如弦转化、Hellinger转化等),然后再使用转化后的数据计算欧几里得距离。尽管弦距离、Hellinger距离等然是对称指数的范畴,但是相较于使用原始物种丰度数据所得的欧几里得距离,弦距离、Hellinger距离的优势体现在存在距离的“上限”,降低了欧几里得距离对“物种丰度”的敏感性,有效减少了“双零”问题导致的误差。但是我们通常选择使用非对称的Bray-curtis距离等。

    Bray-curtis距离的取值范围范围由0(两个群落的物种类型和丰度完全一致)到1(两个群落不共享任何物种),因此它也可以直接通过“1 – 距离指数=相似性指数”转化为相似性指数(上文提到的“相似百分率”)。Bray-curtis距离适用于群落物种数据分析的原因在于它是一个非对称指数,可有效忽略双零。

    Unifrac距离(Unifrac distance):

    Unifrac距离,它常用于微生物群落的数据中(例如,16S扩增子测序)。Bray-curtis距离仅考虑了物种的存在与否及其丰度,没有考虑物种之间的进化关系,距离0表示两个群落的物种组成结构完全一致。在Unifrac距离中,除了关注考虑了物种的存在与否及其丰度外,还将物种之间的进化关系考虑在内,距离0更侧重于表示两个群落的进化分类完全一致。

    在16S扩增子测序中,根据16S序列组成构建OTUs进化树,OTUs之间存在进化上的联系,因此不同OTUs之间的(系统发育)距离实际上有“亲远”之分。将系统发育树和OTUs丰度数据共同考虑到距离计算就是Unifrac距离。而其它非进化距离,忽略了OTUs之间的进化关系,认为OTUs间的关系平等。

    Unifrac距离分为非加权Unifrac距离(Unweighted unifrac distance)和加权Unifrac距离(Weighted unifrac distance)。两种的主要区别是否考虑了物种的丰度。非加权Unifrac距离只考虑了物种有无的变化,不关注物种丰度,若两个微生物群落间存在的物种种类完全一致,则距离为0;加权Unifrac距离同时考虑物种有无和物种丰度的变化,若两个微生物群落间存在的物种种类及丰度完全一致,则距离为0。

    关于Unifrac距离的计算方法,详见 http://scikit-bio.org/docs/latest/generated/skbio.diversity.beta.html。

    排序

    排序过程是将样品或物种排列在一定的空间,在一个低维空间中,使相似的样品或物种距离相近,相异的样品或物种距离较远。也就是说排序可以揭示微生物-环境间的生态关系,降低维数,减少坐标轴的数目,使排序轴能够反映一定的生态梯度。常见的方法有:PCA、PCoA、CA、DCA、NMDS、RDA、CCA等等。

    PCoA排序

    主坐标分析(PCoA;也称为度量多维标度)展示在低维欧氏空间中的对象间(非)相似性。PCoA不使用原始数据,而是使用(相异)相似度矩阵作为输入。
    从概念上讲,它与主成分分析(PCA)和对应分析(CA)相似,后者分别保留对象之间的欧几里得距离和χ2(卡方)距离。但是,PCoA可以保留任何(距离)度量产生的距离,从而可以更灵活地处理复杂的生态学数据。

    如果对解析理解有困难,可以结合下图理解。假如你是一本养花工具宣传册的摄影师,你正在拍摄一个水壶。水壶是三维的,但是照片是二维的,为了更全面的把水壶展示给客户,你需要从不同角度拍几张图片。下图是你从水壶背面,正面,正上方,斜上方的照片。

    图2. 主坐标分析的通俗解析。图片来源 https://blog.csdn.net/HLBoy_happy

    我们看到斜上方的照片能最好的展示我们观察的特征。我们的PCoA分析的第1/2主轴的结果就类似于此图。

    PCoA和PCA的不同之处:PCA是基于OTU 表两两样品间欧式距离计算,而PCoA是基于两两样品之间的任何一种距离距离计算,即有更多的选择,如果PCoA 也使用欧式距离,则PCA和PCoA的分析结果是一样的。

    另外,PCoA是基于距离矩阵,它的排序的目的是将N个样品排列在一定的空间,使得样品间的空间差异与原始距离矩阵保持一致,这类排序方法也称作多维标定排序(Multi—dimensional scaling)。如果排序依赖于相异系数的数值,就叫有度量多维标定法(metric multi—dimensional scaling)所以说PCoA分析也叫有度量多维标定法;如果排序仅仅决定于相异系数的大小顺序(秩次排序),则称为无度量多维标定法(Non—Metric Multi—Dimensional Scaling;NMDS)

    NMDS 排序

    非度量多维尺度法是一种将多维空间的研究对象(样本或变量)简化到低维空间进行定位、分析和归类,同时又保留对象间原始关系的数据分析方法。适用于无法获得研究对象间精确的相似性或相异性数据,仅能得到他们之间等级关系数据的情形。其基本特征是将对象间的相似性或相异性数据看成点间距离的单调函数,在保持原始数据次序(秩)关系的基础上,用新的相同次序的数据列替换原始数据进行度量型多维尺度分析。换句话说,当资料不适合直接进行变量型多维尺度分析时,对其进行变量变换,再采用变量型多维尺度分析,对原始资料而言,就称之为非度量型多维尺度分析。其特点是根据样品中包含的物种信息,以点的形式反映在多维空间上,而对不同样品间的差异程度,则是通过点与点间的距离体现的,最终获得样品的空间定位点图。

    NMDS过程是迭代的,并且分几个步骤进行:

    • 在多维空间中定义群落的原始位置;

    • 指定降低维度的数量(通常为2个维度);

    • 二维构造样本的初始配置;

    • 该初始配置下的距离相对于观察到的(测量的)距离进行回归;

    • 根据回归确定应力(stress)或二维构造与预测值之间的差异;

    如果应力较高,则按减小应力的方向重新定位2维中的点,然后重复进行直到应力低于某个阈值。经验法则:应力<0.05可很好地表示尺寸减小,<0.1非常好,<0.2 还不错,而应力<0.3 有待提高。

    附加说明:最终结果可能会因初始配置(通常是随机的)和迭代次数而有所不同,因此建议多次运行NMDS并尽可能减降低应力值

    首先,NMDS需要距离矩阵或相异矩阵。原始欧几里得距离并不是达到此目的的理想方法:它们对总丰度敏感,因此即使物种的标识不同,也可能将具有相似数量物种的站点(site)视为相似物种。它们对物种的缺失也很敏感,因此可以将缺少相同物种数的站点视为相似物种。

    因此,生态学家使用Bray-Curtis相异性计算,该计算具有许多理想属性:

    • 它不随单位的变化而变化

    • 它不受添加/删除两个群落中不存在的物种的影响

    • 它不受新增群落的影响

    • 它可以识别总丰度的差异

    实例分析

    例1.两地点重复的两组PCoA

    本文于2019年6月5日发表在Nature Biotechnology 杂志(37卷第6期),并选为当期封面文章。点击查看中文解读

    两图并列展示两组间明显的微生物组差异且在不同地点可重复。不同组采用着色配置信椭圆突出组间差异。

    c.基于Bray-Cutis距离的主坐标轴分析(PCoA)表明籼粳稻的根系微生物组在第一主轴分开(P < 0.001,PERMANOVA采用Adonis函数置换检验)。椭圆包括亚种68%的数据。
    d. 基于Bray-Cutis距离的PCoA在地块2中结果表明籼粳稻根系微生物组也在第一主轴分开。

    c, Unconstrained PCoA (for principal coordinates PCo1 and PCo2) with Bray–Curtis distance showing that the root microbiota of indica separate from those of japonica in field I in the first axis (P < 0.001, permutational multivariate analysis of variance (PERMANOVA) by Adonis). Ellipses cover 68% of the data for each rice subspecies. d, Unconstrained PCoA with Bray–Curtis distance showing that the root microbiota of indica separate from those of japonica in field II in the first axis (P < 0.001, PERMANOVA by Adonis).

    结果

    我们发现不同水稻亚种根系微生物组成存在差异。基于Bray-Curtis距离的非限制性主坐标轴分析(PCoA)表明籼粳稻在地块1的微生物组成明显形成两大类,且在第一主轴分开(图1c;附图2),表明水稻亚种分化是微生物组变异的最主要影响因素。同时也观察到了由于地块2的土壤不同,在地块2存在微生物组的变化(附图3;附表1)。但在两块地块中,籼粳稻显著分开保持一致(图1d;附图3)

    We found that the composition of the root bacterial microbiotadiffered in rice subspecies. Unconstrained principal coordinateanalysis (PCoA) of Bray–Curtis distance revealed that theroot microbiota of indica and japonica in field I formed two distinctclusters, which separated along the first coordinate axis(Fig. 1c and Supplementary Fig. 2), indicating that the largest sourceof variation in the rice root microbiota was proximity to the subspeciationbetween indica and japonica. As expected, the root microbiotain field II differed from that in field I due to soil differences(Supplementary Fig. 3 and Supplementary Table 1), but the separationof root microbiota between indica and japonica varieties wasconsistent in the two locations (Fig. 1d and Supplementary Figs. 2and 3).

    例2. PCoA时间序列

    本文是刘永鑫博士负责分析,于2018年发表在中国科学的一篇文章封面文章,详细描述了水稻田间全生育期根系微生物组的变化规律,发表2年被引31次。详见:手把手带你重现菌群封面文章图表。本文对图1中的B/C子图为例进行说明和点评。

    田间水稻微生物组随生育时间变化。以水稻日本晴和IR24为材料,并分别种植于昌平和上庄两地,CP代表北京昌平农场,SZ代表北京海淀上庄。B-C. 主坐标轴分析(PCoA)展示水稻微生物组随时间变化,其中微生物群落结构主要在第1/2轴上随时间变化(B),而不同土壤类型主要在第3轴上明显分开(C)

    Figure 1 The rice root microbiota in fields shift over rice residence time in the field. B−C, Principle coordinate analysis showing that the rice microbiota shifts with rice residence time in the field and developmental stages in the first axis (B) and separated by geographical locations in the third axis (C).

    结果:在所有样品的Bray-Curtis距离的主坐标分析(PCoA)中,土体土壤样品聚集在一起,并且水稻根样品在田间和发育阶段的第一坐标轴上沿着水稻的生长时间从土壤开始移动(图1B),表明稻田在田间的停留时间和发育阶段是影响根系微生物组成的主要因素。另外,尽管根微生物组在第三轴上被地理位置清楚地分开了,但水稻的生长时间和根系微生物组的动态变化在两个不同的地点显示出一致的趋势(图1C)。

    In Principle Coordinate Analysis (PCoA) of Bray-Curtis distance from all samples, bulk soil samples clustered together, and rice root samples shifted farfrom the soil across rice residence time in the field and developmental stages in the first coordinate axis (Figure 1B),indicating that rice residence time in the field and developmental stage are main factors influencing the root microbiota composition. Additionally, although the root microbiotawere clearly separated by geographic location in the third axis, the rice residence time and development dependent shift of the root microbiota showed consistent trends in the two separate fields (Figure 1C).

    • 总结

    1. 图1B/C是基于Bray-Curtis距离进行的PCoA分析,采用散点图展示,并按时间顺序填充彩虹色(比单色过渡明显,但对色盲人群不友好,有些杂志不接受),按不同生态位和地点设置形状,信息较丰富;一般人类颜色区分明显,把颜色赋予想要表达的第一变量,如本文的时间变量,形态分配给次要因素;

    2. 图1B展示PCo1/2轴,组间最大差异为不同生态位与时间梯度上的变化,但 不同地点间是无法很好区分时,我们还需要继续探索其他主坐标轴。本文在图1C展示PCo1/3轴,可进一步看到1轴的差异与时间变化一致,而3轴可以很好分开不同地点

    例3.NMDS分析不同食物昆虫组肠道菌群

    本文由荷兰皇家科学院生态研究所的S. Emilia Hannula和中科院遗传发育所朱峰研究员于2019年8月发表于Nature Communications (https://doi.org/10.1038/s41467-019-09284-w)。揭示了食叶昆虫微生物群落来源于土壤而不是取食植物。中文解读详见:[Nature子刊:植食昆虫微生物组来自土壤](https://mp.weixin.qq.com/s/uiXqcGZEt3QX-V49r88J2w)

    图a-d 代表了植物群落对土壤、毛虫肠道、根系、植物叶片细菌群落的影响。图e-h代表了植物群落对土壤、毛虫肠道、根系、植物叶片真菌群落的影响。NMDS分析基于Bray-Curtis相似性,二维应力值介于0.11-0.18之间。草地植被相关的群落使用亮绿色表示。非禾本草本植物/阔叶草(forb)植被群落使用青绿色点表示。草地和阔叶草植被混合群落使用深绿色表示。每幅图中小点代表样品,大点代表每组样品的中心点。图中的标识为置换检验结果。a,e代表土壤微生物群落。b,f代表食用离体叶片和植株的毛虫肠道微生物。c,g代表植物根系微生物群落,d,h代表叶微生物群落。

    Plant community identity effects on bacterial a–d and fungal (e–h) communities in caterpillars, leaves, roots, and soil. NMDS plots are presented based on Bray–Curtis similarity. The 2D stress value for each panel ranges between 0.11–0.18. Soils originating from grass communities are presented with light green symbols, soils from forb communities with turquoise symbols and soils from mixed grass and forb communities with dark green symbols. In each panel, smaller symbols depict individual samples, centroids are depicted with larger markers. Significance of the plant community treatment effect based on a PERMANOVA is also presented in each panel. a, e represent the composition of microbiomes in soils, b, f microbiomes in caterpillars both on intact plants and on detached leaves. c, g microbiomes in roots and d, h microbiomes in leaves.

    结果

    我们通过两个独立的平行试验,研究了田间植物群落对土壤中微生物群落组成、蒲公英和在这些植物上放养的毛虫的影响。植被群落改变了土壤细菌和真菌群落,但是令人惊讶的是并没有改变蒲公英根系和叶片微生物组成 (图3c, d, g, h)。但是我们却检测到了不同植物群落对毛虫微生物群落的影响,但这只有在以完整植株为食的毛虫中检测到。

    We investigated the legacy effects created by field-grown plant communities, on the composition of microbial communities in soils, dandelions grown in those soils, and caterpillars reared on these plants, in two parallel assays. The composition of the plant community (fast- and slow-growing grasses or forbs) that conditioned the soils that were used, influenced the fungal and bacterial community structure in these soils (Fig. 3a, e). Surprisingly, this did not alter the root- or leaf -associated microbiomes in the dandelion plants that were growing in these soils (Fig. 3c, d, g, h). However, we did detect these soil-derived plant community effects in caterpillar microbiomes, but only when the caterpillars were fed on intact plants (Fig. 3b, f), suggesting that, even though they are plant feeders, the caterpillars had been in direct contact with the soil.

    例4.NMDS分析组间的功能基因类群

    瑞士EAWAG研究所,西湖大学鞠峰教授于2019年发表于The ISME Journal的成果,发现污水厂抗性组受细菌组成和基因交换驱动且出水中抗性表达活跃(https://doi.org/10.1038/s41396-018-0277-8)。全文解读详见:[ISME:污水中抗性基因在细菌群落和基因交换双重驱动下在出水中活跃表达](https://mp.weixin.qq.com/s/dN0_iQkDSFS42TcFOjKXIA)。

    污水厂不同处理部位抗性基因组的组成与细菌群落组成相关。a-c NMDS分析描述了不同部位之间基于ARG(a)、BRG(b)、MRG(c)组成的Bary-curtis距离。

    Resistome composition correlates with bacterial community composition and phylogeny across wastewater treatment compart-ments. a–c Non-metric multidimensional scaling plots depict Bray-Curtis distances between treatment compartments based on relative abundance of antibiotic (a), biocide (b), and metal (c) resistance genes in the metagenomes.

    结果

    细菌抗性组系统发育结构。为了测试在我们的数据集中是否存在这种情况,我们使用排序方法来跟踪抗性组(图5)的结构变化。无论分析是基于抗性组、杀菌剂和金属抗性基因的丰度指标(图5a–c),样品始终分为三个主要类别。

    Bacterial phylogeny structures soil resistomes. To test if this was the case in our dataset, we used ordination to follow structural variations in the resistomes (Fig. 5) both between and within treatment compartments. The samples consistently clustered into three main groups by treatment compartment with bioreactor samples closely clustered together, whether the analysis was based on abundance metrics of antibiotic, biocide, and metal resistance genes (Fig. 5a–c).

    PCoA/NMDS实战

    关于更多本项目中示例文件的下载,R包安装的内容,请参考之前的章节:

    安装和载入R包
    if (!requireNamespace("devtools", quietly=TRUE))
        install.packages("devtools")
    library(devtools)
    if (!requireNamespace("amplicon", quietly=TRUE))
        install_github("microbiota/amplicon")
    suppressWarnings(suppressMessages(library(amplicon)))
    主坐标轴分析 PCoA

    主坐标轴分析(principal coordinate analysis, PCoA)

    在amplicon包中有beta_pcoa函数可以快速绘制PCoA散点图,并按组着色和添加68%的置信椭圆

    本次绘制使用函数内置数据演示,查看函数帮助,打问题(?)+函数名,如?beta_pcoa

    # 使用内置数据,输入距离矩阵、元数据和分组绘制PCoA
    (p=beta_pcoa(beta_bray_curtis, metadata, "Group"))
    # 保存位图和矢量图,分别用于预览和出版
    ggsave(paste0("p1.PCoA.bray.jpg"), p, width=89, height=56, units="mm")
    ggsave(paste0("p1.PCoA.bray.pdf"), p, width=89, height=56, units="mm")

    图1. 散点图展示基于Bray-Curtis距离的Beta多样性PCoA。点代表样本,颜色代表分组,并按每组添加68%置信度的椭圆方便组间比较,图中展示主坐标分析的前两轴,解析率见坐标轴括号中。

    本次测试数据来自刘永鑫博士负责分析并于2019年发表于Science的文章(即上图展示的内置数据),讨论了基因型对菌群的影响。详见宏基因组公众号详细解读-Science:拟南芥三萜化合物特异调控根系微生物组

    我们再演示从文件读取距离矩阵和元数据,数据位于Data/Science2019目录,本次需要元数据(metadata.txt)和Beta多样性距离矩阵(alpha/unifrac.txt)两个输入文件(注:距离矩阵这里是由USEARCH -beta_div生成,将在扩增子流程部分详细介绍,也可由vegan包计算生成)。

    # USEARCH可选距离矩阵bray_curtis、unifrac、unifrac_binary、jaccard、manhatten、euclidean
    # 设置距离矩阵类似,本次使用unifrac
    distance_type="unifrac"
    # 读取距离矩阵并预测前3行3列,再读取元数据
    distance_mat=read.table(paste0("../Data/Science2019/beta/",distance_type,".txt"), header=T, row.names=1, sep="\t", comment.char="")
    distance_mat[1:3, 1:3]
    metadata=read.table("../Data/Science2019/metadata.txt", header=T, row.names=1, sep="\t", comment.char="", stringsAsFactors=F)
    # PCoA散点图,按metadata的Group列着色,添加标签,PCo1/3
    (p=beta_pcoa(distance_mat, metadata, groupID="Group", ellipse=T, label=T, PCo=13))
    # 保存8:5的半版图
    ggsave(paste0("p2.PCoA.unifrac.jpg"), p, width=89, height=56, units="mm")
    ggsave(paste0("p2.PCoA.unifrac.pdf"), p, width=89, height=56, units="mm")

    图2. 基于Unifrac距离的PCoA。看到PCo 1/2的解析率比前面Bray-Curtis距离结果有提高,表明在Unifrac距离前两主轴一般可以解析更高比例的差异。由于Unifrac考虑进化距离,一般样本/组间差异会进一步缩小。

    有时我们更想知识组间是否存在显著差异,使用?beta_pcoa_stat查看函数帮助,使用距离矩阵指定分组,对全部组别两两差异使用adonis函数进行检测。

    # 使用adonis检测组件差异,注意是两两检测,并且将检测结果保存到当前路径下。
    beta_pcoa_stat(distance_mat, metadata, "Group", "beta_pcoa_stat.txt")
    # 结果文件默认见beta_pcoa_stat.txt
    beta_pcoa_stat(dis_mat=distance_mat, metadata=metadata, groupID="Group", pairwise=F, pairwise_list="../Data/Science2019/compare.txt")

    输入文件compare.txt,即两组比较列表,制表符分隔。

    KO    WT
    OE    WT

    结果文件beta_pcoa_stat.txt,计算时间和两组比较P值

    Sat Jun 27 22:35:03 2020
    KO    WT    0.0174982501749825
    OE    WT    0.0096990300969903
    非度量多维尺度NMDS

    我们将会用到BetaDiv函数,这个函数依赖phyloseq可以计算目前主流的降维排序方法,包括DCA, CCA, RDA, NMDS, MDS, PCoA, PCA, LDA,t-sne,并且结合了群落差异分析,为大家带来相对全面的beta多样性分析。我们下面以NMDS为例演示函数的用法。?BetaDiv 显示帮助

    # 安装Bioconductor的R包phyloseq
    if (!requireNamespace("BiocManager", quietly=TRUE))
        install.packages("BiocManager")
    suppressWarnings(suppressMessages(library(BiocManager)))
    if (!requireNamespace("phyloseq", quietly=TRUE))
        BiocManager::install("phyloseq")
    library(phyloseq)
    
    # 输入抽平标准化的特征表、元数据、分组列名、距离类型、降维和统计方法
    result=BetaDiv(otu=otutab_rare, map=metadata, group="Group",
                     dist="bray", method="NMDS", Micromet="adonis")
    # 返回结果列表:标准图,数据,标签图,成对比较结果,整体结果
    
    #提取排序散点图(结果列表中的1)
    (p=result[[1]])
    ggsave(paste0("p3.NMDS.bray.jpg"), p, width=89, height=56, units="mm")
    ggsave(paste0("p3.NMDS.bray.pdf"), p, width=89, height=56, units="mm")

    图3. NMDS分析样本微生物群落结构,按组着色,stress值显示于左上角。

    # 提取出图坐标
    plotdata=result[[2]]
    plotdata[1:3,1:3]
    
    # 提取带标签排序散点图
    (p=result[[3]])
    ggsave(paste0("p4.NMDS.bray.label.jpg"), p, width=89, height=56, units="mm")
    ggsave(paste0("p4.NMDS.bray.label.pdf"), p, width=89, height=56, units="mm")

    图4. NMDS分析样本微生物群落结构,添加样本标签。

    # 提取两两比较差异检测结果
    (pair=result[[4]])
    
    # 提取全部组整体差异检测结果
    (Mtest=result[[5]])
    了解PhyloSeq对象

    输入数据除了支持特征表、元数据+分组;还支持phyloseq对象。

    我们将特征表和元数据转换为PhyloSeq对象(简称ps)

    # 指定目标分组列为Group,作为默认分组
    metadata$Group=metadata[["Group"]]
    # 输入特征表和元数据为PhyloSeq对象
    ps=phyloseq(otu_table(as.matrix(otutab),taxa_are_rows=TRUE),
                sample_data(metadata),phy_tree(tree))

    当然,除了常用的adonis置换检验,可选anosim/MRPP差异显著性检验方法。

    result=BetaDiv(ps=ps, dist="bray", method ="NMDS", Micromet ="anosim")
    result[[5]]

    参考文献

    刘尧,Beta多样性和生态相似性,科学网, http://wap.sciencenet.cn/home.php?mod=space&uid=3406804&do=blog&id=1195182

    HLBayes,通俗理解PCA降维作用,CSDN,https://blog.csdn.net/HLBoy_happy/article/details/77146012

    Xiao-Tao Jiang, Xin Peng, Guan-Hua Deng, Hua-Fang Sheng, Yu Wang, Hong-Wei Zhou & Nora Fung-Yee Tam. (2013). Illumina Sequencing of 16S rRNA Tag Revealed Spatial Variations of Bacterial Communities in a Mangrove Wetland. Microbial Ecology 66, 96-104, doi: https://doi.org/10.1007/s00248-013-0238-8

    Jingying Zhang, Yong-Xin Liu, Na Zhang, Bin Hu, Tao Jin, Haoran Xu, Yuan Qin, Pengxu Yan, Xiaoning Zhang, Xiaoxuan Guo, Jing Hui, Shouyun Cao, Xin Wang, Chao Wang, Hui Wang, Baoyuan Qu, Guangyi Fan, Lixing Yuan, Ruben Garrido-Oter, Chengcai Chu & Yang Bai. (2019). NRT1.1B is associated with root microbiota composition and nitrogen use in field-grown rice. Nature Biotechnology 37, 676-684, doi: https://doi.org/10.1038/s41587-019-0104-4

    Jingying Zhang, Na Zhang, Yong-Xin Liu, Xiaoning Zhang, Bin Hu, Yuan Qin, Haoran Xu, Hui Wang, Xiaoxuan Guo, Jingmei Qian, Wei Wang, Pengfan Zhang, Tao Jin, Chengcai Chu & Yang Bai. (2018). Root microbiota shift in rice correlates with resident time in the field and developmental stage. Science China Life Sciences 61, 613-621, doi: https://doi.org/10.1007/s11427-018-9284-4

    S. Emilia Hannula, Feng Zhu, Robin Heinen & T. Martijn Bezemer. (2019). Foliar-feeding insects acquire microbiomes from the soil rather than the host plant. Nature Communications 10, 1254, doi: https://doi.org/10.1038/s41467-019-09284-w

    Feng Ju, Karin Beck, Xiaole Yin, Andreas Maccagnan, Christa S. McArdell, Heinz P. Singer, David R. Johnson, Tong Zhang & Helmut Bürgmann. (2019). Wastewater treatment plant resistomes are shaped by bacterial composition, genetic exchange, and upregulated expression in the effluent microbiomes. The ISME Journal 13, 346-360, doi: https://doi.org/10.1038/s41396-018-0277-8

    责编:刘永鑫 中科院遗传发育所

    版本更新历史

    1.0.0,文涛,初稿

    1.0.1,刘永鑫,主题限定为非限制排序,添加实例和整理代码

    1.0.2,席娇,文字修改

    1.0.3,文涛,删减背景中非必需理论,校对全文

    1.0.4,刘永鑫,添加PCoA背景示意图,整理参考文献

    猜你喜欢

    10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

    系列教程:微生物组入门 Biostar 微生物组  宏基因组

    专业技能:学术图表 高分文章 生信宝典 不可或缺的人

    一文读懂:宏基因组 寄生虫益处 进化树

    必备技能:提问 搜索  Endnote

    文献阅读 热心肠 SemanticScholar Geenmedical

    扩增子分析:图表解读 分析流程 统计绘图

    16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

    在线工具:16S预测培养基 生信绘图

    科研经验:云笔记  云协作 公众号

    编程模板: Shell  R Perl

    生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

    写在后面

    为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

    学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

    点击阅读原文,跳转最新文章目录阅读

    展开全文
  • 使用QIIME进行 进化树,Alpha,Beta多样性 分析 上回讲到,使用Usearch进行进化树,Alpha,Beta多样性的分析。同时,我们还要再次强调QIIME的伟大之处在于全流程分析的能力。因此,使用QIIME同样可以进行上述分析过程...

    使用QIIME进行 进化树,Alpha,Beta多样性 分析


    上回讲到,使用Usearch进行进化树,Alpha,Beta多样性的分析。同时,我们还要再次强调QIIME的伟大之处在于全流程分析的能力。因此,使用QIIME同样可以进行上述分析过程。因此,将QIIME进行进化树,Alpha,Beta多样性 分析的脚本粘贴如下,怀着开放科研的心态,供有需要的朋友参考。同时,需要注意的是因为每个人的使用环境不同,可能部分无法正常运行,因此这对于新手来说可能不是那么友好。

    #!/bin/bash
    ## 使用QIIME进行 进化树,Alpha,Beta多样性 分析
    
    ## 文件
    HOME=`pwd`                ### 操作空间
    temp=${HOME}/temp2              ### 临时文件存放目录
    res=${HOME}/res2                ### 结果文件存放目录
    data=${HOME}/seq                ### 测序数据存放位置
    refdb=${HOME}/database          ### 参考测序数据库
    err=${HOME}/err2                ### 错误信息
    log=${HOME}/log2                ### 日志信息
    
    printf "最终的OTU表:%s\t最终的OTU序列:%s\n"${res}/otu_table_tax.txt ${res}/rep_seqs.fasta
    echo "进化树构建"
    # clustalo多序列比对,如果没有请安装Clustal Omega
    clustalo -i ${res}/rep_seqs.fasta -o ${temp}/rep_seqs_align.fa --seqtype=DNA --full --force --threads=30
    
    echo "筛选结果中保守序列和保守区"
    filter_alignment.py -i ${temp}/rep_seqs_align.fa -o ${temp}/  # rep_seqs_align_pfiltered.fa, only very short conserved region saved
    
    echo "基于fasttree建树"
    make_phylogeny.py -i ${temp}/rep_seqs_align_pfiltered.fasta -o ${res}/rep_seqs.tree # generate tree by FastTree
    
    echo "Alpha多样性"
    echo "查看样品的数据量最小值"
    biom summarize-table -i ${res}/otu_table3.biom
    
    echo "基于最小值进行重抽样标准化"
    single_rarefaction.py -i ${res}/otu_table3.biom -o ${temp}/otu_table_rare.biom -d 2797
    
    echo "计算常用的四种Alpha多样性指数"
    alpha_diversity.py -i ${temp}/otu_table_rare.biom -o ${res}/alpha.txt -t ${res}/rep_seqs.tree -m shannon,chao1,observed_otus,PD_whole_tree
    
    echo "Beta多样性"
    echo "CSS标准化OTU表"
    normalize_table.py -i ${res}/otu_table3.biom -o ${temp}/otu_table_css.biom -a CSS
    
    echo "转换标准化OTU表为文本,用于后期绘图"
    biom convert -i ${temp}/otu_table_css.biom -o ${res}/otu_table_css.txt --table-type="OTU table" --to-tsv
    
    echo "删除表格多余信息,方便R读取"
    sed -i '/# Const/d;s/#OTU //g;s/ID.//g' ${res}/otu_table_css.txt
    
    echo "计算Beta多样性"
    beta_diversity.py -i ${temp}/otu_table_css.biom -o ${res}/beta/ -t ${res}/rep_seqs.tree -m weighted_unifrac,unweighted_unifrac
    
    echo "Beta多样性距离文件整理,方便R读取"
    sed -i 's/^\t//g' ${res}/beta/*
    
    echo "物种分类统计,筛选进化树和其他操作"
    cd ${HOME}
    echo "按物种分类级别分类汇总"
    echo "结果按门、纲、目、科、属五个级别进行分类汇总,对应结果的L2-L6"
    summarize_taxa.py -i ${res}/otu_table3.biom -o ${res}/sum_taxa # summary each level percentage
    echo "修改一下文本表头,适合R读取的表格格式"
    sed -i '/# Const/d;s/#OTU ID.//g' ${res}/sum_taxa/* # format for R read
    #echo "以门为例查看结果"
    #less -S ${res}/sum_taxa/otu_table3_L2.txt
    
    echo "筛选可展示的进化树"
    echo "选择OTU表中丰度大于0.1%的OTU"
    filter_otus_from_otu_table.py --min_count_fraction 0.001 -i ${res}/otu_table3.biom -o ${temp}/otu_table_k1.biom
    
    echo "获得对应的fasta序列"
    filter_fasta.py -f ${res}/rep_seqs.fasta -o ${temp}/tax_rep_seqs.fa -b ${temp}/otu_table_k1.biom 
    
    echo "统计序列数量,104条,一般100条左右即有大数据的B格,又能读懂和更清规律和细节"
    grep -c '>' ${temp}/tax_rep_seqs.fa # 104
    
    echo "多序列比对"
    clustalo -i ${temp}/tax_rep_seqs.fa -o ${temp}/tax_rep_seqs_clus.fa --seqtype=DNA --full --force --threads=30
    
    echo "建树"
    make_phylogeny.py -i ${temp}/tax_rep_seqs_clus.fa -o ${temp}/tax_rep_seqs.tree
    
    echo "格式转换为R ggtree可用的树"
    sed "s/'//g" ${temp}/tax_rep_seqs.tree > ${res}/tax_rep_seqs.tree # remove '
    
    echo "获得序列ID"
    grep '>' ${temp}/tax_rep_seqs_clus.fa|sed 's/>//g' > ${temp}/tax_rep_seqs_clus.id
    
    echo "获得这些序列的物种注释,用于树上着色显示不同分类信息"
    awk 'BEGIN{OFS="\t";FS="\t"} NR==FNR {a[$1]=$0} NR>FNR {print a[$1]}' ${res}/rep_seqs_tax_assignments.txt ${temp}/tax_rep_seqs_clus.id|sed 's/; /\t/g'|cut -f 1-5 |sed 's/p__//g;s/c__//g;s/o__//g' > ${res}/tax_rep_seqs.tax
    
    echo " 其他操作"
    #echo "将mappingfile转换为R可读的实验设计"
    #sed 's/#//' mappingfile.txt > ${res}/design.txt
    
    echo "转换文本otu_table格式为R可读"
    sed '/# Const/d;s/#OTU //g;s/ID.//g' ${res}/otu_table3.txt > ${res}/otu_table.txt
    
    echo "转换物种注释信息为制表符分隔,方便R读取"
    sed 's/;/\t/g;s/ //g' ${res}/rep_seqs_tax_assignments.txt > ${res}/rep_seqs_tax.txt
    

     

    展开全文
  • 222Beta多样性限制性排序CPCoA/CCA/RDA/LDA本节作者:文涛,南京农业大学;刘永鑫,中科院遗传发育所版本1.0.5,更新日期:2020年8月12日本项目永久地址:htt...
  • beta多样性计算

    千次阅读 2020-08-26 19:53:25
    file=c("salmonRNA.csv","salmonDNA.csv") for (j in file) { c<-read.csv(j,row.names=1,stringsAsFactors=FALSE) vegan::vegdist(t(c),method="bray") %>% ape::pcoa()->pcoa tmp<...
  • 多样性
  • 在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CPCoA/CCA/RDA)。 Beta多样性 Beat多样性是生态学概念,专指不同组...
  • Beta 多样性排序分析方法与比较

    千次阅读 2019-08-14 09:48:37
    β 多样性是不同生态系统之间多样性的比较,是物种组成沿环境梯度或者群落间的变化率,用来表示物种种类对环境异质性的反应。一般来说,包括物种改变(多少)和物种产生(有无)两部分。 意义 衡量不同因素下的样本...
  • 在基于高通量测序的微生物群落分析中,若提到如何描述不同群落β多样性是否存在差异或者评估组内或组间的差异程度,我们通常可以想到很多方法,这些都是描述群落β多样性特征的常见分析。例如,一般我们首先会基于...
  • 在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CPCoA/CCA/RDA)。 Beta多样性 Beat多样性是生态学概念,专指...
  • 222Beta多样性限制性排序CPCoA/CCA/RDA/LDA 本节作者:文涛,南京农业大学;刘永鑫,中科院遗传发育所 版本1.0.5,更新日期:2020年8月12日 本项目永久地址:https://github.com/YongxinLiu/MicrobiomeStatPlot ,...
  • 扩增子统计绘图2散点图:Beta多样性

    千次阅读 2017-08-21 20:37:56
    2散点图:Beta多样性,组间整体差异分析 图中WT和OE在第一轴明显分开的,但WT与KO间区分不明显,是否存在显著差别呢。 我们以WT和OE为例,统计组间是否存在显著差异。 # 统计WT与KO间是否有差异显著 # ...
  • 《扩增子分析解读》系列文章介绍扩增子分析是目前宏基因组研究中最常用的技术,由于微生物组受环境影响大,实验间重复较差,更需要更多的实验重复和分析技术来保证结果的准确、可重复。本系统文章叫分析解读,即...
  • 阐述微生物组的Beta多样性:从全局比对到局部比对Elucidating the Beta-Diversity of the Microbiome: from Global Alignme...
  • 营业额模式的交互式可视化(例如beta多样性); 和 假设检验的随机化。 Biodiverse是开源的,并支持用户开发的扩展。 它既可以通过图形用户界面(GUI)使用,也可以通过用户编写的脚本使用。 支持300多个索引。 ...
  • 宏-物种多样性学习

    2018-07-31 11:40:28
    生物多样性包括遗传多样性、物种多样性和生态系统多样性。 物种多样性是指动物、植物和微生物种类的丰富性,它们是人类生存和发展的基础,它是生物多样性的简单度量,只计算给定地区的不同物种数量。在数学公式里用...
  • 多模态和跨模态的文章博主在之前的都整理过了,最近对多样性比较感兴趣,但是发现做这个方向的人确实太少了(虽然在推荐里面做的人还是挺多的)。暂时把目前看到觉得还不错的文章整理一下。 Diversity 在推荐系统的...
  • 菌群多样性分析报告

    千次阅读 2019-03-16 23:01:32
    在开始实验项目之前,明确...下面给出菌群多样性分析报告中应包含的大致内容,并对实验流程做出指导性的阐述。 1.项目背景与概况 简单阐述所研究项目的国内外现状,本项目的目的与意义。 2.材料与方法(materi...
  • Alpha多样性之箱线图解读

    千次阅读 2018-08-02 11:32:12
    Alpha多样性之箱线图的解读 以下内容转载: 扩增子图表解读1箱线图:Alpha多样性,老板再也不操心的我文献阅读了 图中元素解释 Y轴标签Estimaated species Richness代表估计的物种丰富度信息,刻度范围从0...
  • β多样性算法

    千次阅读 2018-05-06 14:16:23
    利用列联表分析的方法得到一个卡方统计量来衡量两个体之间的差异。 卡方统计量越大, 表明个体的选择对变量的取值有显著影响, 这也意味着两个体 之间的差异越大。 稀有物种会对距离产生明显影响, 应先剔除稀有...
  • NC:恢复菌群多样性或能降低耐药性

    千次阅读 2019-04-26 19:53:28
    文章目录建筑环境中的人为微生物耐药性热心肠日报摘要背景结果限制与微生物多样性减少相关附表1. 基于单个宏基因组样品blastx比对NCBI NR估计Alpha多样性图1. 宏基因组数据物种和功能香农多样性指数组间比较附图1. ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,477
精华内容 2,190
关键字:

beta多样性