精华内容
下载资源
问答
  • R语言ggplot2可视化NHANES数据集年龄和身高的关系并按照性别因子分析男性和女性的差异
    多人点赞
    2021-11-17 20:47:43

    R语言ggplot2可视化NHANES数据集年龄和身高的关系并按照性别因子分析男性和女性的差异

    目录

    更多相关内容
  • 安全技术-网络信息-基于网络媒体监测语料库汉语的性别语言差异实证研究.pdf
  • 通过对98名英语专业学生的语言能力和语用能力的实证研究,发现学生的英语语言能力和语用能力具有显著的相关性,英语语用能力具有性别差异,女生明显优于男生。针对研究结果做了尝试性的分析和解释,并提出外语教学中应该...
  • 语言性别差异与跨性别交际PPT课件.pptx
  • 尽管性别差异一直是新兴语言技能实验的重点,但数据仍然匮乏,并且在大学生活中并不一致。 关于大学是否对男女学生产生同等影响以及在整个大学社会化过程中这些差异的一致性的问题仍然悬而未决。 在这项研究中,已...
  • 用社会角色的观点对英语语言的词、语音、语法等方面的性别差异进行了研究,认为男女扮演不同的社会角色是造成英语语言性别差异的主要原因。
  • 从网上通信工具看网络聊天语言风格的性别差异.docx
  • 《傲慢与偏见》中语言使用的性别差异研究.zip
  • 大学生恭维语言语行为特征及其性别差异调查研究.docx
  • 对于性别差异,我们指的是广泛的心理学,神经科学和认知科学研究,其中涉及解决问题,语言技能,逻辑推理和其他主题。 智力测验表明,平均而言,任何一种性别都比另一种性别拥有更多的一般智力。 尽管人们在一般...
  • 语言记忆和腿部协调分测验中发现了男性和女性之间的表现差异。 在言语记忆和数字记忆分测验中发现了白人和非白人儿童之间的差异。 在过去,测试中的文化和性别偏见问题从未像现在这样明显。 最近,对无偏见评估的...
  • library(ggplot2) # 注意,符号与负数之间最好有一个或多个空格, #比如 ,而非 否则无法运行 # FDR 边界限定和logFC下边界限定 # 注意, logFC 、 FDR 是行列头名(见R语言零基础基因/数据差异分析(一)) df...


    注意,本 系列 有连贯性,每一步都很详细,每一步都很重要,请耐心读完!!

    结果展示

    在这里插入图片描述

    安装ggplot2包

    如图操作



    找到并勾上即可。

    制作方法

    关于 基因 的选定标准,即logFC和FDR,请仔细阅读代码修改即可,这里给出的标准是:
    |log2(FC)| > 1 且 FDR < 0.01

    
    #选择文件
    df=read.csv(file.choose(),
    	header = T #是否有标题,T表示有,F反之
    	)
    #加载包(反正多余不影响)
    library(ggplot2)
    
    # 注意,符号与负数之间最好有一个或多个空格,
    #比如 < -1,而非 <-1否则无法运行
    # FDR 边界限定和logFC下边界限定
    # 注意, logFC 、 FDR 是行列头名(见R语言零基础基因/数据差异分析(一))
    df[which(df$FDR < 0.01 & df$logFC > 1),'Title'] <- 'up' #上调趋势筛选
    # FDR 边界限定和logFC上边界限定
    df[which(df$FDR < 0.01 & (df$logFC < -1)),'Title'] <- 'dowm' #下调趋势筛选
    df[!(df$Title %in% c('up', 'dowm')),'Title'] <- 'no'
    
    img = ggplot(df, 
                    aes(x = logFC, y = -log10(FDR))) +
      geom_point(aes(color = Title), size = 0) +
      scale_colour_manual(
    	limits = c('up', 'dowm', 'no'),
    	#下行分别对应  上调、下调、不变基因颜色
    	values = c('blue', 'red', 'gray40'), 
    	# 下行分别对应  上调、下调、不变基因表示文字
    	labels = c('Enriched OTUs', 'Depleted OTUs', 'No diff OTUs')
    ) +
    #下行分别对应  X、Y轴名称
      labs(x = 'log2(FC)', y = '-log10(FDR)')
    
    img = img +
      theme(panel.grid.major = 
              element_line(color = 'gray', size = 0.2),      	  panel.background = 
              element_rect(color = 'black', fill = 'transparent')) +
         geom_vline(xintercept = c(-2, 2), color = 'gray', linetype = 2, size = 0.5) + 
      geom_hline(yintercept = -log10(0.05), color = 'gray', linetype = 2, size = 0.5) +
      theme(legend.title = element_blank(), legend.key = element_rect(fill = 'transparent'), legend.background = element_rect(fill = 'transparent'), legend.position = c(0.2, 0.9))
    
    #运行输出图片(耐心等待)
    img
    
    

    输出结果:在这里插入图片描述
    运行代码,此时会弹出选择文件,注意上一章我们所说的文件,选择上即可。

    可以如此导出

    展开全文
  • 点击上方蓝字关注我们基于深度学习的大脑性别差异分析温景熙,于胡飞,辛江,唐艳中南大学计算机学院,湖南 长沙 410083摘要:深度学习被广泛应用于大脑的相关研究中。通过构建深度学...

    点击上方蓝字关注我们


    基于深度学习的大脑性别差异分析

    温景熙, 于胡飞, 辛江, 唐艳

    中南大学计算机学院,湖南 长沙 410083

     

     摘要深度学习被广泛应用于大脑的相关研究中。通过构建深度学习模型对弥散张量成像数据的各向异性分数进行了性别分类,并通过深度学习特征可视化方法提取了不同性别的重要特征,最后对可视化结果进行了基于体素的分析。结果显示,提出的模型能够准确预测性别,并且达到了96.2%的分类准确率。在可视化的结果中,发现男女大脑之间存在明显差异,其中存在差异的脑区主要表现在胼胝体、顶叶下叶和基底神经节等,这些脑区揭示了男女之间的大脑差异可能与运动能力、数学运算、身体形象感知和情绪控制等方面的能力相关。

    关键词深度学习 ; 弥散张量成像 ; 性别分类 ; 特征可视化

    论文引用格式:

    温景熙, 于胡飞, 辛江, 等. 基于深度学习的大脑性别差异分析[J]. 大数据, 2021, 7(4): 130-140.

    WEN J X, YU H F, XIN J, et al. Analysis of gender differences in the brain based on deep learning[J]. Big Data Research, 2021, 7(4):  130-140.


    1 引言

    研究表明,不同性别的人在认知、行为和智力等方面存在差异。人脑功能在性别之间的差异也非常明显,主要表现在情感处理、身体感知、数学运算和运动控制等方面。然而,尽管有许多针对性别功能差异的研究,但大多未得到一致的认可。本文致力于大脑性别差异研究,进一步发现和证明男女之间的大脑差异。

    磁共振成像(magnetic resonance imaging,MRI)是一种非侵入性成像技术,它利用磁共振原理从人体获得电磁信号,从而重建出人体信息。目前,基于MRI的人脑研究已得到广泛应用。弥散张量成像(diffusion tensor imaging,DTI)是一种特殊的MRI技术,它通过追踪大脑纤维束中水分子的移动方向来表征神经纤维的结构。弥散张量成像可以通过计算各向异性分数(fraction anisotropy,FA)来定量评估神经纤维的各向异性。研究发现,通过计算FA可以观察大脑发育、衰老过程中的细微变化。目前,有非常多的研究者致力于DTI的性别差异研究。参考文献通过DTI来观察不同性别中的白质微观结构;参考文献则发现了不同性别与行为发展之间的联系。然而也有研究认为,研究的现状尚不能确定男女大脑是否存在差异,仍需要更多的研究来证明。

    深度学习是一种非常强大的机器学习方法,它通过深层网络提取数据中的非线性特性,并通过堆叠多个非线性层来构建复杂的函数模型,这使得深度学习拥有非常强的表征和学习能力。同时,深度学习还展现了强大的小样本学习能力,尤其是迁移学习方法,它通过冻结预训练模型的浅层网络,仅重新训练最后几层网络即可达到小样本下模型的快速学习目的。因此对于难以采集的MRI数据的研究,深度学习方法显得尤为重要。目前,深度学习已经被广泛应用到MRI的研究中,并且取得了不错的效果。在参考文献中,研究人员利用深度学习对肿瘤进行分类,得到了97%的准确率,而他们的实验数据只有66个MRI样本;在参考文献中,作者利用深度学习确定了大脑中用于区分不同年龄的关键脑区。在大脑性别分类方面,同样有非常多基于深度学习的研究。

    研究大脑性别差异,特征可视化是必不可少的。在传统的机器学习方法中,特征由人手工构造。而在深度学习中,随着隐藏层的加深,特征被不断地抽象,人们越来越难以理解,而提取关键特征也变得非常不易。在一项基于深度学习性别分类的研究中,研究人员尝试采用逐次保留一个脑区的方式来证明不同大脑脑区的性别差异,并且根据神经网络第一个隐藏层的特征图的均值和信息熵,提出男性大脑比女性大脑更为复杂的可能性。在深度学习的研究中,已有许多可靠的特征可视化方法相继被提出,其中导向梯度类激活图(gradient-weighted class activation mapping,Grad-CAM)方法被广泛推崇。在深度学习MRI领域,Grad-CAM方法也逐渐被应用于大脑的差异分析。在参考文献关于大脑MRI的年龄预测中,通过Grad-CAM方法发现了大脑额叶区与年龄变化相关。

    本文收集了大量DTI数据,通过预处理得到标准大小的FA;然后根据FA构建3D卷积神经网络(3D-CNN),实现大脑性别的可靠分类;最后通过构建3D导向梯度类激活图结构实现性别特征的可视化,并根据可视化结果进行性别差异分析。

    2 DTI性别分类及特征可视化方法

    为了研究不同性别之间的大脑差异以及在性别分类中不同脑区的重要性,首先需要保证深度学习模型分类的可靠性;然后提取数据在不同类别中的显著特征,通过显著特征得到一般性(平均)大脑性别差异;最后将差异对应到各个脑区上,得到脑区的重要性情况。本节将详细介绍如何通过3D卷积神经网络进行性别分类,并通过神经网络模型的可视化方法得到与类别相关的重要特征。在此,输入神经网络的数据是DTI的全脑FA,即大小为182×218×182的三维脑图。

    2.1 基于3D卷积神经网络的性别分类模型

    本文采用3D卷积神经网络进行性别分类。3D卷积神经网络模型结构如图1所示,模型分为输入、卷积、全连接和输出4个部分。其中输入是一个三维脑图,输出是性别分类的结果。在卷积过程中,本文采用全卷积的形式,即在下采样的过程中使用移动步长为2×2×2的卷积代替步长为2的池化。模型中包含7个卷积层,卷积核大小都为3×3×3,卷积核数量分别为16、32、32、64、64、128、128。在每个卷积层的后面,都有一个批归一化层和一个LeakyReLU激活层。在最后一层卷积完成后,将特征图伸展成一维,然后进入全连接层。模型中包含2层全连接,第一个全连接层有64个神经元,紧接着一个ReLU激活层。由于样本标签编码采用独热编码的形式,第二个全连接层共有2个神经元,全连接层后面紧接着Softmax激活层。

    图1   3D卷积神经网络模型结构

    2.2 基于3D导向梯度类激活图的特征可视化方法

    神经网络能够很好地预测性别,但是不能直接得到深层网络提取到的性别特征。导向梯度类激活图是神经网络模型可视化的一种方法,它同样适用于本研究中3D图像的特征可视化。该方法的可视化结果由导向反向传播图和特征热图两个矩阵点乘得到。导向反向传播图由深层特征图导向反向传播得到,该图表示网络模型提取到的所有性别特征。特征热图先通过类别对深层特征图求梯度,该梯度表示特征图对预测类别正负影响的大小,然后对i、j、k 3个方向进行全局平均池化(global average pooling,GAP),得到单个通道上的特征图权重:

    其中,p表示最后一层特征图序列中单个通道上的特征图,c表示单个输入对应的类别,yc表示预测值,表示第p个通道的特征图在i、j、k上的体素,Z1表示最后一层特征图中单个通道特征图的体素数量。接着,根据这个特征图权重对特征图进行加权和计算,并执行一次ReLU操作(去除与当前类别无关的值)得到特征热图:

    最后,对特征热图进行上采样(线性插值),得到与原图大小相同的特征热图。

    在全连接之前的特征图大小为8×10×8,缩放后大小为182×218×182。线性插值的过程会使得特征热图变得非常模糊且不准确。于是本文对Grad-CAM做了一些改进,如图2所示。首先通过反向求导得到最后一层特征图的梯度值ϕ,然后对该梯度进行一次ReLU操作来去除与类别无关的数值;接着对倒数第二层下采样(即倒数第三层卷积)后的特征图进行一次反向求导,得到对最后一层中与类别相关的信息的贡献值,并进行一次全局平均池化操作,得到单个通道上的特征图权重:

    其中,表示倒数第二层特征图序列中第q个通道特征图的在i、j、k上的体素,Z2表示倒数第二层特征图中单个通道特征图的体素数量。根据该特征图权重对特征图进行加权和计算,并执行ReLU操作得到特征热图:

    图2   DTI性别分类特征可视化结构

    最后,将两个特征热图根据一定的权值(λ、µ)相加,得到最终的特征热图:

    3 实验与结果分析

    3.1 数据集及预处理

    本文数据来自美国南加州大学的人类连接组项目(human connectome project, HCP)的公开数据集。该数据集包括1 055个健康成年人脑的弥散张量成像数据,其中男性487个,女性568个,年龄范围为22~35岁。

    在预处理过程中,本文将数据放入功能磁共振成像软件库FSL(FMRIB software library)进行格式转换、B0提取、波脑、涡流矫正和计算张量等,得到各向异性分数。由于FA是一个不标准的三维脑图,与标准的DTI 1 mm各向同性模板(FMRIB58_FA)存在差异,需要进行一次非线性配准,将FA配准到该标准空间中。最后得到一个大小为182×218×182的三维脑图。

    3.2 全卷积神经网络分类结果比较

    由于DTI数据量较少,本文模型采用十折交叉验证的方式进行模型评估。首先将数据随机分成10份,并保证每份数据的男女比例尽可能相等,然后分别将其中的一份作为验证集进行模型验证。在模型优化中,采用交叉熵损失函数来计算损失,优化器采用Adam(学习率为0.000 1,衰减率为0.5)。通过反向传播对模型参数进行优化。

    通过本文实验设计的全卷积神经网络,10次验证的平均分类结果达到了96.2%的准确率。在数据相同且同样十折交叉验证的条件下,普通3D-CNN的模型分类准确率为93.3%,相比之下,本实验模型准确率有了2.9%的提升。而对比机器学习方法支持向量机(support vector machine,SVM)78.2%的准确率,本文模型的准确率提升更大。

    3.3 可视化方法对比

    基于Grad-CAM的可视化方法可以得到导向反向传播和类激活图2个三维矩阵,如图3所示。其中导向反向传播矩阵包含了从最深层特征图中提取到的所有特征,这些特征同时包含了男性和女性的全部特征,对类别并不敏感,如图3(a)所示。特征热图则与类别相关,其中由最后一层特征图得到的特征热图在较大范围内显示了关键特征所在的位置,但图片面积较大、脑区分布较多,导致显著区域过大,难以判断关键特征所属脑区,如图3(b)所示。相比之下,本文提出的特征可视化方法得到的特征热图不仅能观察到更准确的特征位置,同时还保证了不损失最深层特征图提取到的重要信息,如图3(d)所示。

    图3   可视化方法结果对比

    在特征热图的权重选择中,当λ=1、µ=0时,特征位置非常不明确,无法判断关键特征所在脑区,如图3(b)所示;当λ=0.5、µ=0.5时,特征位置相对改善,但仍然存在一些不明确的区域,如图3(c)所示;而当λ=0.3、µ=0.7时达到最佳,特征位置非常明确,同时还尽可能地保留了最深层特征图的信息,如图3(d)所示。

    3.4 性别分类中的重要脑区分析

    白质和灰质是人脑的重要组成部分,研究者根据大脑区域功能的不同进行脑区划分。根据国际脑图谱协会的划分标准,将大脑白质分成48个感兴趣脑区(白质标签JHU-ICBM-labels)。同时,根据人类脑网络组图谱(human brainnetome atlas)的划分方法,将大脑灰质分成246个感兴趣脑区(灰质标签BN_Atlas_246)。由于预处理时将FA配准到了标准空间,可确定每个输入数据的脑区位置是固定的,可以根据不同脑区对应特征热图的体素值之和,得到不同脑区在性别分类中的重要性排名。如图4和图5所示,在性别分类中不同脑区对类别的贡献是不一样的,有些脑区对性别分类起到了非常重要的作用。

    图4   白质感兴趣区域体素和排名(各脑区根据体素和大小升序进行标签)

    图5   灰质感兴趣区域体素和排名(各脑区根据体素和大小升序进行标签)

    在图4中,男性和女性排名最高的两个白质脑区都为胼胝体压部和小脑中脚。胼胝体横跨纵向裂缝的一部分,连接左右大脑,从而使它们之间能够进行通信。有研究认为,男性胼胝体与半球内的联系更大,而女性胼胝体与半球之间的联系更为紧密。小脑中脚是连接小脑与脑桥的结构,是将小脑与脑桥相联系的高级神经中枢,它保证了随意运动的精确和有效。研究表明,运动和运动强度与小脑功能连通性变化相关。因此,本研究结果显示,小脑中脚存在性别差异,可能与成年男女运动强度和运动量有关。

    在图5中,男性排名最高的两个灰质脑区分别为左脑顶叶下叶腹侧区(IPL, A39rv_L)和额上回中间区(SFG, A9m_R),女性排名最高的两个灰质脑区分别为右脑顶叶下叶腹侧区(IPL, A39rv_R)和梭状回腹腔区(FuG, A20rv_R)。顶叶下叶腹侧区是顶叶的一部分,该区域跟语言功能、数学运算和身体形象感知等功能有关。本研究中男性左脑顶叶下叶和女性右脑顶叶下叶分别排名较高,体现了不同性别在该脑区存在差异,同时揭示了在左右脑的顶叶下叶之间存在功能差异的可能性。此外,额上回是与自我意识相关的脑区,与感觉系统的动作相关。梭状回的功能目前尚不清楚,有研究认为该脑区可能与颜色信息处理相关。

    3.5 男女平均显著特征对比及分析

    为了显示一般情况下显著特征所在脑区,需要找到显著特征所在位置。因此在不同性别的全脑中,本文将特征热图按体素求平均,得到平均结果。如图6所示,平均显著特征主要分布在胼胝体压部和左脑基底神经节背尾状两个脑区。其中,基底神经节是一组大脑皮层下核的总称,它与大脑皮层、丘脑和脑干等脑区紧密相连。基底神经节具有多种功能,包括控制自主运动、程序学习、认知和情绪等。此外,基底神经节在性别中也存在差异,如参考文献[39]认为不同性别可能会影响基底神经节的体积。从图6(b)、图6(d)可知,不同性别在左脑基底神经节背尾状的特征都较为显著,这可能是该脑区在不同性别中的结构或者纤维束存在差异。该实验结果至少揭示了在控制自主运动能力、程度学习能力或者情绪变化等大脑功能中的一种或几种性别差异。

    图6   男女显著特征对比

    3.6 男女之间不同脑区的差异

    在参考文献中,作者通过神经网络第一个隐藏层得到的特征图的均值和信息熵,发现男女之间存在差异。尤其是信息熵,在32个特征图中男性信息熵大于女性的明显较多。该研究发现,在特征热图分脑区的体素值求和中,男性数值大的脑区也明显多于女性。其中,在白质中男性体素值之和大于女性的脑区为39个,女性大于男性的脑区为9个;在灰质中男性体素值之和大于女性的脑区为239个,女性大于男性的脑区为7个。这些结果进一步发现和证明了男女大脑之间存在非常大的差异。

    4 结束语

    本文使用深度学习方法在DTI数据上进行了性别分类,并使用深度神经网络可视化方法对性别特征进行了提取和分析。在模型分类中,本文提出的全卷积网络模型达到了更高的分类精度。在可视化方法中,本文通过最后两层下采样后的特征图获得特征热图,从图3可以看出,在可视化的结果中显著特征的位置更为准确。本文根据特征热图的体素值来进行脑区排名和求平均显著特征。从图4和图5可以看出,不同脑区在不同性别中的重要性是不同的,尤其表现在白质中的胼胝体压部和小脑中脚,灰质中男性的左脑顶叶下叶腹侧区和额上回中间区及女性的右脑顶叶下叶腹侧区和梭状回腹腔区。从图6可以看出,性别分类的显著特征主要表现在胼胝体压部和左脑基底神经节背尾状两个脑区。本文还通过特征热图的分脑区的体素值求和发现,无论在白质中还是在灰质中,男性数值大的脑区都远远多于女性。上述所有结果都证明了男女大脑之间存在明显差异,尤其是胼胝体、顶叶下叶和基底神经节等多个脑区,它们与运动能力、数学运算、身体形象感知和情绪控制等方面相关。

    本文提出的可靠的深度学习分类方法将有机会被用于临床分析。通过模型得到的一般性男女大脑结构将有利于发现与性别相关的疾病患病情况和观察大脑的病变过程。本文设计的深度学习分类模型以及可视化方法也为以后对大脑MRI的各种研究提供了参考。本文在可视化结果中进一步发现和证明了大脑的性别差异,其中主要的差异表现在胼胝体、顶叶下叶和基底神经节等脑区中。该结果对分析大脑性别差异具有一定的参考价值,同时也为以后更深入、更具体的性别差异分析提供了一定的指导。

    然而,本文的深度学习模型虽然能够准确地预测性别,但本文数据来自单个数据域,并不一定能够很好地解决来自不同数据域的性别分类问题。此外, MRI特征可视化一直都是非常重要的研究内容,尤其在DTI数据中,当前的研究仍然缺少有效的方法。在未来的工作中,笔者将继续研究不同性别的人的大脑MRI数据,从而进一步发现和证明男女之间的大脑差异。

    作者简介

    温景熙(1993-),男,中南大学计算机学院硕士生,主要研究方向为医疗影像处理、模式识别、图像处理等。

    于胡飞(1994-),男,中南大学计算机学院硕士生,主要研究方向为深度学习、图像处理、医疗大数据等。

    辛江(1994-),男,中南大学计算机学院硕士生,主要研究方向为数据挖掘、医疗大数据、网络大数据、深度学习等。

    唐艳(1976-),女,中南大学计算机学院副教授,主要研究方向为医疗影像处理、医疗大数据、深度学习等。

    联系我们:

    Tel:010-81055448

           010-81055490

           010-81055534

    E-mail:bdr@bjxintong.com.cn 

    http://www.infocomm-journal.com/bdr

    http://www.j-bigdataresearch.com.cn/

    转载、合作:010-81055537

    大数据期刊

    《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,并被评为2018年、2019年国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

    关注《大数据》期刊微信公众号,获取更多内容

    展开全文
  • 作为社会经济地位、性别和认知能力函数的场依赖-独立认知风格的差异学校心理学第 30 卷,4 月 /993 场依赖-独立认知风格的差异作为社会经济地位、性别和认知能力的函数和 FRANCESCA ROIG-LOPEZ 巴塞罗那大学 本研究...
  • R语言 logistic回归 亚组分析 差异性比较 用R语言做Logistic回归分析,模型出来后对样本进行亚组分析,比如性别男、女,计算出了各亚组我所关心自变量的偏回归系数和偏回归系数的标准误,对偏回归系数做指数运算求得...
  • 这项研究的目的是要解决在这两个教室中如何使用语言,以及两者之间的语言差异是否表明他们所在社区的经济,社会和种族差异。 根据我在每个机构的工作经验,我能够观察到特定语言在三个星期内的运作方式以及在何种...
  • 在这项研究中,我们使用情感分析来了解医患性别对口对语言交流的影响。 研究结果表明,相同(一致性)和异性(不一致)之间的交流模式存在显着差异。 本研究的结果还表明,与女医生相比,男医生与患者交谈的次数...
  • 许多研究对语言学习者的语言学习态度的性别差异进行了研究,但很少有人关注他们对语言教学的态度。 鉴于学生是课堂的主体,所有的教学活动都应该以学生为中心,因此本研究采用大规模问卷调查来调查中国英语学习者对...
  • 您将看到数据集包含有关客户的信息,例如性别,任期,电话服务,互联网服务,家属等。 Once you click the Transform button, you should see the following Query Editor. 单击“转换”按钮后,应该会看到以下查询...

    power bi dax

    Microsoft Power BI supports two different languages, M language and DAX (Data Analysis Expression) that can be used to filter, manage, and visualize data.

    Microsoft Power BI支持两种不同的语言,即M语言和DAX(数据分析表达式),可用于过滤,管理和可视化数据。

    M can be considered as a query formula language and it can be used in the Power BI Query Editor in order to prepare data before it can be loaded into the Power BI model.

    M可以视为查询公式语言,可以在Power BI查询编辑器中使用M,以便在将数据加载到Power BI模型之前准备数据。

    On the flip side, DAX is an analytical data calculation language which can be used for in-depth data analysis during the Data View phase.

    另一方面,DAX是一种分析数据计算语言,可用于“数据视图”阶段的深入数据分析。

    M and DAX are not dependent upon each other and follow totally different structures and logics, and have different underlying codes. M and DAX cannot be used simultaneously since the M language is used in Query Editor while DAX is mostly used in the Data View model.

    M和DAX不相互依赖,遵循完全不同的结构和逻辑,并且具有不同的基础代码。 M和DAX无法同时使用,因为在查询编辑器中使用M语言,而在数据视图模型中则主要使用DAX。

    This blog post will show you how M and DAX differ from each other in Power BI, with the help of examples. See this article for a quick introduction to DAX.

    这篇博客文章将通过示例帮助您了解M和DAX在Power BI中的区别。 请参阅本文以快速了解DAX

    导入数据集 (Importing the Dataset)

    In this section, we will import a dummy dataset that we will use to execute our M Language and DAX queries. To do this start by clicking the “Get data” button in the top menu as shown in the following screenshot.

    在本节中,我们将导入一个虚拟数据集,该数据集将用于执行M语言和DAX查询。 为此,请单击顶部菜单中的“获取数据”按钮,如以下屏幕截图所示。

    Selecting the Get Data choice in Power BI

    A new dialogue will list all the data links open to Power BI.

    一个新的对话框将列出打开到Power BI的所有数据链接。

    Insert web” into the search section, and very shortly a Web” data option will appear and also an icon will show in the All data source options. Select the Web” option and then click “connect” at the bottom. This is clear in the screenshot below.

    在搜索部分插入“ Web”,不久将出现“ Web”数据选项,并且在“ 所有数据源”选项中也会显示一个图标。 选择“ Web”选项,然后单击底部的“连接”。 这在下面的屏幕截图中很明显。

    Selecting the 'Web' data source.

    The dialogue window you can see in the screenshot below will appear. You now need to insert the URL below into the field labelled URL:

    您将在下面的屏幕快照中看到的对话窗口将会出现。 现在,您需要将下面的URL插入标有URL的字段中:

    https://raw.githubusercontent.com/treselle-systems/customer_churn_analysis/master/WA_Fn-UseC_-Telco-Customer-Churn.csv

    https://raw.githubusercontent.com/treselle-systems/customer_churn_analysis/master/WA_Fn-UseC_-Telco-Customer-Churn.csv

    Click “OK” to confirm when this is done.

    单击“确定”以确认何时完成。

    Here is a screenshot for your reference:

    这是屏幕截图供您参考:

    Entering the URL for the data source that we want to use.

    This URL takes Power BI to Github which holds the CSV data file that we need. The data file details a telecom customer churn dataset. It contains data about the customers of a telecom company, that left the company after a certain period.

    此URL将Power BI带到Github,Github包含我们需要的CSV数据文件。 数据文件详细描述了电信客户流失数据集。 它包含有关电信公司客户的数据,该数据在一段时间后离开了该公司。

    Depending upon the size of the file, it might take a while to download the data from the remote site.

    根据文件的大小,可能需要一段时间才能从远程站点下载数据。

    Once the data is downloaded, you have two options: either you can directly import the data to Data/Report View, or you can first load the data into Query Editor. Since the M Language works in the Query Editor, we will first load the data into the Query Editor by clicking “Transform Data” as shown in the following screenshot:

    数据下载完成后,您有两个选择:要么直接将数据导入到“数据/报表视图”,要么首先将数据加载到“查询编辑器”中。 由于M语言可在查询编辑器中使用,因此我们将首先通过单击“转换数据”将数据加载到查询编辑器中,如以下屏幕截图所示:

    Our data set showing in Query Editor.

    You will see that the dataset contains information about a customer, such as a gender, tenure, phone service, internet service, dependents etc.

    您将看到数据集包含有关客户的信息,例如性别,任期,电话服务,互联网服务,家属等。

    Once you click the Transform button, you should see the following Query Editor.

    单击“转换”按钮后,应该会看到以下查询编辑器。

    Our dataset once we've clicked 'Transform'

    M语言和DAX之间的区别 (Differences between M Language and DAX)

    In the previous section, we connected Power BI to a dummy dataset on GitHub. In this section, you will see with the help of examples, the differences between M Language and DAX.

    在上一节中,我们将Power BI连接到GitHub上的虚拟数据集。 在本节中,您将借助示例了解M语言和DAX之间的区别。

    M语言 (M Language)

    First, we will see what M is and how it is used in Power BI. As I said earlier, the M Language is used to manage and filter data in the Query Editor. If you have closed the Query Editor, you can open it by clicking the “Edit Queries” option from the top menu.

    首先,我们将了解M是什么以及如何在Power BI中使用它。 如前所述,M语言用于在查询编辑器中管理和过滤数据。 如果您关闭了查询编辑器,则可以通过单击顶部菜单中的“编辑查询”选项来将其打开。

    Reopening the query editor by clicking edit queries

    In the Query editor, the only table name on the left panel of the screen will be your table, as shown below. Click on the “WA_Fn-UseC_-Telco-Customer-Churn” data table from the left panel of the query editor as shown below:

    在查询编辑器中,屏幕左侧面板上唯一的表名称将是您的表,如下所示。 从查询编辑器的左侧面板中单击“ WA_Fn-UseC_-Telco-Customer-Churn”数据表,如下所示:

    Screenshot showing what happens when the table name is clicked.

    To see the queries in M. Select any column, for example, “Partner” and then click the “Remove Columns” button from the top menu. It will remove the “Partner” column from the table as shown below:

    要查看M中的查询,请选择任何列,例如“ Partner”,然后从顶部菜单中单击“ Remove Columns”按钮。 它将从表中删除“合作伙伴”列,如下所示:

    Removing the partners column from our data

    Next, click on the “View” option from the top menu as highlighted in the following screenshot.

    接下来,单击顶部菜单中的“查看”选项,如以下屏幕快照中突出显示的那样。

    Selecting View from the top menu

    Click the “Formula Bar” checkbox. You should now see a query in the formula bar as highlighted in the following screenshot. The query here is “= Table.RemoveColumns(#”Changed Type”,{“Partner”}). This query is an M language query used to remove the “Partner” column from the selected table. You can see that the M Language query is more similar to an SQL or LINQ (Language Integrated Query) command in C#.

    单击“配方栏”复选框。 现在,您应该在编辑栏中看到一个查询,如以下屏幕快照中突出显示的那样。 这里的查询是“ = Table.RemoveColumns(#“更改类型”,{“合作伙伴”})。 此查询是一种M语言查询,用于从所选表中删除“合作伙伴”列。 您可以看到,M语言查询与C#中SQL或LINQ(语言集成查询)命令更为相似。

    Seeing the query contained in the 'Dependents' column in Power BI

    To see all the previously executed M queries in your dataset, you can click on “View – Advanced Editor” as shown in the following screenshot.

    要查看数据集中所有先前执行的M查询,可以单击“视图–高级编辑器”,如以下屏幕截图所示。

    Using 'Advanced Editor' in Query Editor to show all M language queries.

    Once you click on the “Advanced Editor” option from the top menu, you should see the Advanced Editor window as shown below. The Advanced Editor window contains all the M language queries that you have executed till now in the current session.

    单击顶部菜单中的“高级编辑器”选项后,您将看到如下所示的“高级编辑器”窗口。 “高级编辑器”窗口包含您在当前会话中迄今为止执行的所有M语言查询。

    Output of Advanced Editor showing previous M queries.

    You can see that the last query is the one that removed the “Partner” column from the table. Before that, the “Change Type” query is used to assign the data types to different columns in the dataset. And previous to that, the “Promoted Headers” query is used to set the header columns. If you execute another query, that will appear at the bottom in the query list in the “Advance Editor”.

    您可以看到,最后一个查询是从表中删除“合作伙伴”列的查询。 在此之前,“更改类型”查询用于将数据类型分配给数据集中的不同列。 在此之前,“提升标题”查询用于设置标题列。 如果执行另一个查询,该查询将显示在“高级编辑器”中查询列表的底部。

    Let us try to add a simple column in the books table and see the M query for that. Click on the “Add Column -> Custom Column” option in the menu at the top of the window, as you can see below:

    让我们尝试在books表中添加一个简单的列,并查看M查询。 在窗口顶部的菜单中,点击“添加列->自定义列”选项,如下所示:

    Adding a custom column.

    You should see the window below. Click on the “TotalCharges” and “MonthlyCharges” columns one by one and then click the “Insert” button to insert them on the query editor window. In the query editor window, add a “+” sign between the two-column names and click the “OK” button.

    您应该看到下面的窗口。 依次单击“总计费用”和“每月费用”列,然后单击“插入”按钮以将它们插入查询编辑器窗口中。 在查询编辑器窗口中,在两个列的名称之间添加“ +”号,然后单击“确定”按钮。

    Seeing up a custom column.

    You should see a new column “Monthly-Total” added to the table as shown below. In the formula bar, you can also see the M query generated to create the “Monthly-Total” column. The “Monthly-Total” column basically displays the sum of values in the “TotalCharges” and “MonthlyCharges” columns.

    您应该看到一个新列“ Monthly-Total”添加到表中,如下所示。 在公式栏中,您还可以看到生成的M查询以创建“月总计”列。 “每月总计”列基本上在“总计费用”和“每月费用”列中显示值的总和。

    The new column showing in Query Editor.

    Now if you again open the “Advanced Editor” window, you will see the query used to add the “Monthly-Total” column at the bottom of the queries in the advanced editor.

    现在,如果再次打开“高级编辑器”窗口,您将在高级编辑器中查询的底部看到用于添加“每月总数”列的查询。

    The Advanced Editor showing our new query.

    Now we know how the M Language works and how it looks like. In the next section, we will try to create the same “Monthly-Total 2” column via DAX (Data Analysis Expression).

    现在我们知道了M语言的工作原理和外观。 在下一节中,我们将尝试通过DAX(数据分析表达式)创建相同的“每月总计2”列。

    DAX queries are executed in the Data View; therefore, we have to move the data from the Query Editor to the data view. To do so, in the Query Editor, click on the “Close & Apply” option from the top menu as shown below:

    DAX查询在数据视图中执行; 因此,我们必须将数据从查询编辑器移动到数据视图。 为此,在查询编辑器中,单击顶部菜单中的“关闭并应用”选项,如下所示:

    Opening the Data view in Power BI.

    Once you click the “Close & Apply” button, the Data View will be opened.

    单击“关闭并应用”按钮后,将打开数据视图。

    DAX(数据分析表达式) (DAX (Data Analysis Expression))

    In this section, we will see how to add a new column to the Books table using DAX. In the Data View, click on “Modeling -> New Column” option from the top menu as shown below:

    在本节中,我们将看到如何使用DAX将新列添加到Books表中。 在数据视图中,从顶部菜单中单击“建模->新建列”选项,如下所示:

    Creating a new column in the data view.

    You should see the following window once you click the “New Column” option. In the formula bar, you can see the default column name. You can execute the DAX queries in this formula bar.

    单击“新建列”选项后,应该会看到以下窗口。 在编辑栏中,您可以看到默认的列名称。 您可以在此编辑栏中执行DAX查询。

    Executing a DAX query in the formula bar

    Enter the query “Monthly-Total 2 = [TotalCharges] + [MonthlyCharges]” in the formula bar and hit the “Enter” key. Once you hit enter, you will see a new column “Monthly-Total 2” which displays the sum of values in the “TotalCharges” and “MonthlyCharges” columns.

    在编辑栏中输入查询“每月总计2 = [每月费用] + [每月费用]”,然后按“ Enter”键。 按下Enter键后,您将看到一个新列“ Monthly-Total 2”,该列在“ TotalCharges”和“ MonthlyCharges”列中显示值的总和。

    Our new formula operating in the formula bar.

    You can see that the DAX queries are more similar to MS Excel.

    您可以看到DAX查询与MS Excel更相似。

    结论 (Conclusion)

    M Language and DAX are the two languages supported by Power BI to manipulate, filter and analyse the data. Though both languages have similar functionalities, they operate independently of each other. M is used to pre-process the data inside the Query Editor whereas DAX is used to analyse the data after the data is loaded into the Data View Model.

    M语言和DAX是Power BI支持的两种用于处理,过滤和分析数据的语言。 尽管两种语言具有相似的功能,但它们彼此独立地运行。 M用于在查询编辑器中预处理数据,而DAX用于在将数据加载到数据视图模型中之后分析数据。

    翻译自: https://www.sqlshack.com/differences-between-the-m-language-and-dax-in-power-bi/

    power bi dax

    展开全文
  • 在这项研究中,研究人员旨在:1)确定中学生最常用的策略以提高他们的口语能力,以及2)分析性别使用策略上是否存在差异。 采用混合方法来回答研究问题。 来自郊区的60名中学生参加了调查,有6名学生自愿参加了半...
  • 伊利诺伊州心理语言能力测试修订版的因子结构焦虑和非正常考官在 WISC 子测试中的角色 349 I)I LORENZO, LT, & NAGLER, E. 考官对斯坦福-比奈的差异。 心理报告,1968, 22, 443-447。 KASPER, JC, THRONE, FM, &...
  • 面板平滑转移回归(PSTR)分析案例实现 3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR) 4.R语言泊松Poisson回归模型分析案例 5.R语言回归中的Hosmer-Lemeshow拟合优度检验 6.r语言中对LASSO回归,Ridge岭回归...
  • 英语语言文化中存在着男女性别差异,这种差异表现在语音、语义、语法等各个方面.本文分析了英语语言中的女性语言现象,和女性语言的特点,以及这些女性语言特点的形成因素和形成原因.通过分析加深了我们对英语...
  • R语言实现伦敦各地区预期寿命与全国平均水平差异地理数据可视化(热力图) 使用R语言实现 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法...
  • 中治疗组之间的初步分析和性别差异的初步分析结果表明,没有显着的主效应或交互效应。 治疗组和男孩和女孩的受试者在接受语言智商和运动协调方面分别相对同质。 通过对三个标准中每一个的听觉语言回忆进行方差实验的...
  • 文章目录犯罪心理的性别差异性别差异及其对犯罪的影响女性的生理发展男女两性的心理差异犯罪的性别差异 犯罪心理的性别差异 性别差异及其对犯罪的影响 男女两性在性别上的差异是非常突出的。造成性别差异的原因...
  • 该项目下载了该内容并进行了一系列实验,以查看我们是否可以找到人们在性别薪酬差距统计上的得分与他们谈论该主题的方式,主题或差异。 作者注; 这些都不是经验证据,更像是对该主题的有趣探索。 我们无法得出...
  • R语言类别数据可视化、条形图及其变种、树状图、马赛克图及其变种、关联图和独立性检验的P值图
  • 分析关联性,例如分析性别(levels = 男或女)与寿命的关系 > with(mtcars,t.test(mpg,vs)) ##单纯两组数据之间的比较 Welch Two Sample t-test data: mpg and vs t = 18.382, df = 31.434, p-value ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 11,092
精华内容 4,436
关键字:

性别语言差异