精华内容
下载资源
问答
  • R语言词云图
    2022-04-04 23:18:02

    背景介绍

    词云图大家都很常见,主要是用来展示词语的频次,用来发现突出贡献的词语!

    用于词云图的工具很多,但制作过程有些麻烦!今天我们来使用R语言做一下词云图,看看会有什么结果!

    词云图教程

    1.首先我们准备一个Excel文件,将单词或者词语,以及对应的频次整理出来,如下所示,放在R语言对应的路径下

    2.打开RStudio,进行安装相应的R包

     # 安装词云图包并加载
     install.packages("wordcloud2")
     library(wordcloud2)

    3.因为我们需要读取xlsx文件,所以得安装并加载读取Excel的包

     # 安装并加载读取Excel的包
     install.packages("openxlsx")
     library(openxlsx)

    4.读取Excel文件

     # 读取Excel文件
     wordmap <- read.xlsx("demoFreq.xlsx")

    5.开始R语言作图

     # 开始做图
     wordcloud2(wordmap)

    6.wordcloud2包中有很多参数,我们都可以进行调节

    更多相关内容
  • Excel做出R语言风格图

    2018-06-09 16:19:07
    科研的同志们偶尔会看到老外文章数据分析的图很漂亮,很多都是R语言做的,但是入门又比较麻烦,这个Excel插件,可以让你也做出那种图。
  • R语言做词频分析

    2018-12-03 16:07:28
    r语言做词频分析,使用的是mix混合模型 library(jiebaR) library(wordcloud) text('C:\\Users\\gk01\\Desktop\\1.txt',what='') mixseg () seg [text]
  • Copula函数R语言代码

    2019-01-02 14:28:13
    在R-studio中通过R语言代码将两组数据的Copula关系表示出来,并出图表示,使其直观易懂,方便计算
  • R语言列联表

    2021-01-20 12:07:31
    R语言列联表 主要聚焦于类别变量的频数表和列联表,以下是常用的函数和方法: table():使用 N 个类别型变量(因子)创建一个 N 维列联表 xtab():根据一个公式和一个矩阵或数据框创建一个 N 维列联表 CrossTable()...
  • R语言做量化

    2018-05-23 18:06:41
    R 语言做量化,这是我从网上收集的,现在分享给大家,要价不多。
  • PageRank算法R语言实现

    2021-03-03 23:03:55
    同时,我也在Google的SEO,推广自己的博客。经过几个月尝试,我的博客PR到2了,外链也有几万个了。总结下来,还是感叹PageRank的神奇!改变世界的算法,PageRank!PageRank是Google专有的算法,用于衡量特定网页相...
  • 利用spearman相关性分析是构建共现网络的重要方法,但由于OTU table往往有成千上万行,用R自带的corr.test()函数计算较为费时,严重制约我们的分析速度。对spearman相关性分析进行并行化运行可大大节省计算时间,...
  • R语言创建新变量方法

    2021-01-07 04:18:49
    R语言创建新变量方法 在数据分析中,可能需要对数据进行求和、求均值等处理,并且将处理后的数据重新保存到原来的数据框中,这里提供三种可供解决的方法: 数据框$变量名 <- 表达式。若原数据框中含有该变量,则...
  • 使用R语言中的jiebaR包,对中文文本进行分词,求词频,词云图并进行LDA主题建模
  • R语言画心形图-表白好工具,放在合适的地方,可以起到意想不到的效果
  • 使用人工神经网络的方法导入数据,并调用R包实现ANN的分类,并评价分类效果,结果以可选择以PDF形式画出来
  • TOPSIS综合评价是综合评价模型之一,在多目标决策中具有广泛的应用价值。本文使用R语言自己编写源代码实现TOPSIS综合评价模型,方便R语言用户使用该模型应用于实际的学习和工作中!
  • 该资源是2020参加美赛所用代码,主要是的文本分析,LDA,词云,分类统计,时间序列。内含原始数据和代码说明。
  • R语言小波分析wavelet

    2018-05-08 16:37:02
    R语言小波分析wavelet
  • 可以用于F检验
  • r语言做BP神经网络,用的neuralnet安装包,之后想做做sensitivity analysis(灵敏度分析),看输入变量的相对重要性?尝试使用了garson算法和Olden 算法通过用连接权重(connection weights)得出了相对重要性,...
  • R语言 BEKK模型回归

    2017-08-30 19:45:39
    利用R语言,进行bekk模型回归 library(mvtnorm) library(tseries) library(mgarchBEKK) data("C:/Users/li/Desktop/1.csv",sep=",",header=T) .... estimated (simulated) diagnoseBEKK(estimated) ab11$residuals...
  • 利用R语言进行Meta分析,R语言是跨平台的数据分析的利器,而Meta分析是一种重要的数学分析手段。
  • 英国牛津大学的贝叶斯网络教程PPT,含有R语言实例,深入系统的讲解了贝叶斯网络的基本算法和功能。
  • 卡尔曼滤波(平方根算法、序贯算法、线性卡尔曼滤波、扩展卡尔曼滤波、区间卡尔曼滤波、系统误差和观测误差有关的卡尔曼滤波)在R语言中的实现,详细讲述了原理和其中工具包的使用,英文原版。
  • R语言编写的GBDT算法

    2017-03-15 12:35:00
    R语言GBDT算法
  • 使用R语言做多元应用回归模型案例,内置R语言代码。包含相关系数的可视化、回归诊断、变量选择、回归诊断。 版权声明:代码下载只能自己学习使用,切勿用于商业用途,违者必究。
  • 《数据科学:R语言实现》的英文原版。 编辑推荐 R社区领军人物作品,从典型数据科学项目所需工具模型着手,带领读者掌握R语言精华,学会熟练使用多种工具解决各种数据科学难题。 ·探索——以可视化作为R编程起点...
  • 换上新电脑后,一个重要的事情,就是配置好我的R语言分析环境,同时一期视频教程了。本篇内容是视频教程的概要,详细版见视频。 第一步,安装R语言,目前推荐Intel版本的R。 相对于arm64版本的R,Intel版本的R虽然...

    去年11月换了一台16寸Macbook Pro,用上了苹果自己开发的arm架构的M1芯片。换上新电脑后,一个重要的事情,就是配置好我的R语言分析环境,同时做一期视频教程了。本篇内容是视频教程的概要,详细版见视频。

    第一步,安装R语言,目前推荐Intel版本的R。

    相对于arm64版本的R,Intel版本的R虽然需要rosetta转译,存在性能损耗,但同时支持CRAN和Bioconductor里的预编译R包,在安装R包上会省事不少。

    第二步: 安装Rstudio。下载地址为 https://www.rstudio.com/products/rstudio/download/#download

    目前只有intel版本,没有原生的arm版。对于这一步,如果你用虚拟机软件Parallel desktop安装MacOS系统,然后在这个套娃系统安装intel的Rstudio,你会发现这里面的Rstudio会奇卡无比。

    第三步:安装Rswitch.下载地址是 https://rud.is/rswitch/

    安装之后,我们就可以在MacOS里面切换不同版本的R。

    第四步:安装xcode.

    打开命令行输入

    sudo xcode-select --install
    

    第五步: 安装gfortran

    打开 https://mac.r-project.org/tools/index.html,下载intel版本进行安装。

    安装结束后,编辑 ~/.zshrc添加 export PATH=$PATH:/usr/local/gfortran/bin

    第六步: 安装Java。 打开 https://mirrors.tuna.tsinghua.edu.cn/AdoptOpenJDK/17/jdk/x64/mac/

    下载 OpenJDK17U-jdk_x64_mac_hotspot_17.0.2_8.tar.gz

    然后解压缩到指定的目录

    sudo mkdir -p /opt/jdk_x64
    sudo tar xf OpenJDK17U-jdk_x64_mac_hotspot_17.0.2_8.tar.gz -C /opt/jdk_x64
    

    编辑 ~/.Rprofile 文件,添加如下内容

     Sys.setenv("JAVA_HOME"="/opt/jdk_x64/jdk-17.0.2+8/Contents/Home")
    

    由于软件升级,安装包的名字可能会变, 所以不能直接照抄。

    第七步:安装XQuartz。打开https://www.xquartz.org/

    XQuartz目前是2.8.1版本,安装时会注销,parallel Desktop里的MacOS安装的Xquartz,可能无法被调用。

    第八步: R包安装配置。打开 ~/.Rprofile添加清华镜像

    options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
    options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")
    
    展开全文
  • 说明:斜体为R语言代码01数据准备:下载数据集在进行线性回归模拟之前,我们需先准备具有线性关系的数据集。这里以机械工业出版社出版出版的丘祐玮著的《数据科学:R语言实现 (数据科学与工程技术丛书)》中的房屋...

    说明:斜体为R语言代码

    01数据准备:下载数据集

    在进行线性回归模拟之前,我们需先准备具有线性关系的数据集。

    这里以机械工业出版社出版出版的丘祐玮著的《数据科学:R语言实现 (数据科学与工程技术丛书)》中的房屋租赁数据集为例,数据下载网址为https:// raw. GitHubusercontent. com/ ywchiu/ rcookbook/ master/ chapter11/ house_ rental. csv。

    从该网页下载的数据需转存到R语言可读取格式的文件中。这里我们以csv文件格式为例,进行介绍,将数据集存储为house_rental.csv。

    注:以上网页数据若直接粘贴至excel文件再转存为csv文件时,不能分列粘贴,需要将数据按分隔符“,”分列,将每列数据存储在不同的列中。

    或者可以关注后,在后台回复house_rental 获取分列存储的csv文件。

    将上述文件存储在R的工作目录中,或者将R的工作目录设置为上述文件的存储路径。关于R工作目录的修改和查询见本公众号之前发布的文章:000 R工作目录

    02读取csv文件

    R读取csv文件的函数为 read.csv(‘文件名.csv’,header = TRUE)。

    注:文件名需用英文单引号’’包围。

    例:

    > house

    03用函数lm()拟合线性回归

    函数lm()的使用形式为:lm(因变量~自变量, data)。

    回归模型函数lm()可以响应~变量的形式。

    例:拟合house_rental数据集中Price与Sqft变量的关系,其中Sqft为自变量,Price为因变量。

    > lmfit

    输出拟合结果:

    > lmfit

    Call:

    lm(formula = Price ~ Sqft, data = house)

    Coefficients:

    (Intercept) Sqft

    3425.13 38.33

    输出结果显示:截距为3425.13,自变量Sqft对应的系数为38.33.即:Price=3425.13+38.33*Sqft

    04画出趋势线

    03中输出的拟合结果仅是函数表达式,为了更直观地观察Price和Sqft的关系,我们画出散点图和趋势线。

    画散点图:

    > plot(Price ~ Sqft, data = house)

    输出结果:

    画趋势线:使用函数abline(),该函数可以在当前图形上画出一条或多条直线。

    > abline(lmfit, color = 'red')

    输出结果:

    05使用函数summary()获取格式化的拟合结果

    > summary(lmfit)

    Call:

    lm(formula = Price ~ Sqft, data = house)

    Residuals:

    Min 1Q Median 3Q Max

    -76819 -12388 -3093 10024 112227

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) 3425.133 1766.646 1.939 0.053 .

    Sqft 38.334 1.034 37.090 <2e-16 ***

    ---

    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 20130 on 643 degrees of freedom

    Multiple R-squared: 0.6815, Adjusted R-squared: 0.681

    F-statistic: 1376 on 1 and 643 DF, p-value: < 2.2e-16

    在决定拟合模型是否可行时,我们主要看拟合的截距Intercept和自变量系数对应的p-value(Pr)。

    根据显著性水平(一般取0.05或0.01),若p-value小于既定的显著性水平(此例中p-value: < 2.2e-16 < 0.01),说明拒绝原假设H0(斜率为0),接受备择假设(此例中为斜率为38.3340)。

    也可以根据显著性水平检验结果——确定性系数R^2判定模型拟合的优劣,一元线性回归中R方等于皮尔逊积矩相关系数(Pearson product moment correlation coefficient 或Pearson's r)的平方。这种方法计算的R方一定介于0~1之间的正数,该数值越接近于1,说明拟合效果越理想。在一般问题中,R-squared达到0.8以上,回归模型即可接受。

    此例中的Multiple R-squared为0.6815,虽然拟合结果没有特别理想,但也可以接受,另外,根据p-value,拟合结果也可以接受。

    degrees of freedom = n-2,此例中共有645条数据。

    06练习

    可以使用某短视频网站话题数~视频数数据练习线性回归模型。

    在后台回复‘topic_video’获取对应csv数据集。

    展开全文
  • R语言实现SVM预测的代码,简单但是亲测可用。(下载后用记事本打开即可) library(xlsx) library(e1071) #———— 1、加载数据 #训练集 #预测集 #———— 2、数据整理 #建立模型 #预测
  • R语言 神经网络

    2017-12-24 16:22:14
    R语言 神经网络,利用r语言做前馈反向传播神经网络算法
  • 里面包含数据集,R语言代码,代码后面也写了注释,清晰易懂
  • R语言_差异表达分析

    2017-10-21 22:31:08
    介绍R语言用于统计分析差异表达,来源课程内部讲义,注重实战!

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,966,527
精华内容 786,610
关键字:

做r