-
2022-04-04 23:18:02
背景介绍
词云图大家都很常见,主要是用来展示词语的频次,用来发现突出贡献的词语!
用于词云图的工具很多,但制作过程有些麻烦!今天我们来使用R语言做一下词云图,看看会有什么结果!
词云图教程
1.首先我们准备一个Excel文件,将单词或者词语,以及对应的频次整理出来,如下所示,放在R语言对应的路径下
2.打开RStudio,进行安装相应的R包
# 安装词云图包并加载 install.packages("wordcloud2") library(wordcloud2)
3.因为我们需要读取xlsx文件,所以得安装并加载读取Excel的包
# 安装并加载读取Excel的包 install.packages("openxlsx") library(openxlsx)
4.读取Excel文件
# 读取Excel文件 wordmap <- read.xlsx("demoFreq.xlsx")
5.开始R语言作图
# 开始做图 wordcloud2(wordmap)
6.wordcloud2包中有很多参数,我们都可以进行调节
更多相关内容 -
Excel做出R语言风格图
2018-06-09 16:19:07做科研的同志们偶尔会看到老外文章数据分析的图很漂亮,很多都是R语言做的,但是入门又比较麻烦,这个Excel插件,可以让你也做出那种图。 -
R语言做词频分析
2018-12-03 16:07:28用r语言做词频分析,使用的是mix混合模型 library(jiebaR) library(wordcloud) text('C:\\Users\\gk01\\Desktop\\1.txt',what='') mixseg () seg [text] -
Copula函数R语言代码
2019-01-02 14:28:13在R-studio中通过R语言代码将两组数据的Copula关系表示出来,并出图表示,使其直观易懂,方便计算 -
R语言列联表
2021-01-20 12:07:31R语言列联表 主要聚焦于类别变量的频数表和列联表,以下是常用的函数和方法: table():使用 N 个类别型变量(因子)创建一个 N 维列联表 xtab():根据一个公式和一个矩阵或数据框创建一个 N 维列联表 CrossTable()... -
R语言做量化
2018-05-23 18:06:41R 语言做量化,这是我从网上收集的,现在分享给大家,要价不多。 -
PageRank算法R语言实现
2021-03-03 23:03:55同时,我也在做Google的SEO,推广自己的博客。经过几个月尝试,我的博客PR到2了,外链也有几万个了。总结下来,还是感叹PageRank的神奇!改变世界的算法,PageRank!PageRank是Google专有的算法,用于衡量特定网页相... -
R语言并行计算spearman相关系数代码和测试文件.zip
2021-09-12 10:39:17利用spearman相关性分析是构建共现网络的重要方法,但由于OTU table往往有成千上万行,用R自带的corr.test()函数计算较为费时,严重制约我们的分析速度。对spearman相关性分析进行并行化运行可大大节省计算时间,... -
R语言创建新变量方法
2021-01-07 04:18:49R语言创建新变量方法 在数据分析中,可能需要对数据进行求和、求均值等处理,并且将处理后的数据重新保存到原来的数据框中,这里提供三种可供解决的方法: 数据框$变量名 <- 表达式。若原数据框中含有该变量,则... -
R语言jiebaR中文分词并做LDA主题建模
2018-12-03 13:08:33使用R语言中的jiebaR包,对中文文本进行分词,求词频,做词云图并进行LDA主题建模 -
R语言画心形图-用于表白
2018-10-18 09:28:22R语言画心形图-表白好工具,放在合适的地方,可以起到意想不到的效果 -
神经网络做分类的R语言代码
2015-10-19 15:40:18使用人工神经网络的方法导入数据,并调用R包实现ANN的分类,并评价分类效果,结果以可选择以PDF形式画出来 -
R语言实现TOPSIS综合评价
2019-02-23 17:37:23TOPSIS综合评价是综合评价模型之一,在多目标决策中具有广泛的应用价值。本文使用R语言自己编写源代码实现TOPSIS综合评价模型,方便R语言用户使用该模型应用于实际的学习和工作中! -
R语言文本分析案例代码.rar
2020-03-20 21:08:03该资源是2020参加美赛所用代码,主要是做的文本分析,LDA,词云,分类统计,时间序列。内含原始数据和代码说明。 -
R语言小波分析wavelet
2018-05-08 16:37:02R语言小波分析wavelet -
waldtest函数用法_F-test_waldtest_waldtest检验_R语言waldtest_
2021-10-04 05:05:53可以用于做F检验 -
求助:用r语言做BP神经网络,之后请问怎样做sensitivity analysis(灵敏度分析),算相对重要性?
2019-01-25 19:13:25用r语言做BP神经网络,用的neuralnet安装包,之后想做做sensitivity analysis(灵敏度分析),看输入变量的相对重要性?尝试使用了garson算法和Olden 算法通过用连接权重(connection weights)得出了相对重要性,... -
R语言 BEKK模型回归
2017-08-30 19:45:39利用R语言,进行bekk模型回归 library(mvtnorm) library(tseries) library(mgarchBEKK) data("C:/Users/li/Desktop/1.csv",sep=",",header=T) .... estimated (simulated) diagnoseBEKK(estimated) ab11$residuals... -
经典的R语言 Meta分析教程
2018-10-12 20:58:41利用R语言进行Meta分析,R语言是跨平台的数据分析的利器,而Meta分析是一种重要的数学分析手段。 -
贝叶斯网络 R语言实例
2018-04-19 02:09:43英国牛津大学的贝叶斯网络教程PPT,含有R语言实例,深入系统的讲解了贝叶斯网络的基本算法和功能。 -
kalman filtering in R(R语言实现卡尔曼滤波)
2018-07-13 12:10:40卡尔曼滤波(平方根算法、序贯算法、线性卡尔曼滤波、扩展卡尔曼滤波、区间卡尔曼滤波、系统误差和观测误差有关的卡尔曼滤波)在R语言中的实现,详细讲述了原理和其中工具包的使用,英文原版。 -
R语言编写的GBDT算法
2017-03-15 12:35:00R语言GBDT算法 -
R语言案例回归分析.pdf
2020-04-13 16:00:03使用R语言做多元应用回归模型案例,内置R语言代码。包含相关系数的可视化、回归诊断、变量选择、回归诊断。 版权声明:代码下载只能自己学习使用,切勿用于商业用途,违者必究。 -
R语言编程,献给所有做数据统计的程序员
2018-11-21 01:32:44《数据科学:R语言实现》的英文原版。 编辑推荐 R社区领军人物作品,从典型数据科学项目所需工具模型着手,带领读者掌握R语言精华,学会熟练使用多种工具解决各种数据科学难题。 ·探索——以可视化作为R编程起点... -
ARM架构的MacOS如何配置R语言分析环境
2022-02-04 11:04:06换上新电脑后,一个重要的事情,就是配置好我的R语言分析环境,同时做一期视频教程了。本篇内容是视频教程的概要,详细版见视频。 第一步,安装R语言,目前推荐Intel版本的R。 相对于arm64版本的R,Intel版本的R虽然...去年11月换了一台16寸Macbook Pro,用上了苹果自己开发的arm架构的M1芯片。换上新电脑后,一个重要的事情,就是配置好我的R语言分析环境,同时做一期视频教程了。本篇内容是视频教程的概要,详细版见视频。
第一步,安装R语言,目前推荐Intel版本的R。
相对于arm64版本的R,Intel版本的R虽然需要rosetta转译,存在性能损耗,但同时支持CRAN和Bioconductor里的预编译R包,在安装R包上会省事不少。
第二步: 安装Rstudio。下载地址为 https://www.rstudio.com/products/rstudio/download/#download
目前只有intel版本,没有原生的arm版。对于这一步,如果你用虚拟机软件Parallel desktop安装MacOS系统,然后在这个套娃系统安装intel的Rstudio,你会发现这里面的Rstudio会奇卡无比。
第三步:安装Rswitch.下载地址是 https://rud.is/rswitch/
安装之后,我们就可以在MacOS里面切换不同版本的R。
第四步:安装xcode.
打开命令行输入
sudo xcode-select --install
第五步: 安装gfortran
打开 https://mac.r-project.org/tools/index.html,下载intel版本进行安装。
安装结束后,编辑
~/.zshrc
添加export PATH=$PATH:/usr/local/gfortran/bin
第六步: 安装Java。 打开 https://mirrors.tuna.tsinghua.edu.cn/AdoptOpenJDK/17/jdk/x64/mac/
下载 OpenJDK17U-jdk_x64_mac_hotspot_17.0.2_8.tar.gz
然后解压缩到指定的目录
sudo mkdir -p /opt/jdk_x64 sudo tar xf OpenJDK17U-jdk_x64_mac_hotspot_17.0.2_8.tar.gz -C /opt/jdk_x64
编辑 ~/.Rprofile 文件,添加如下内容
Sys.setenv("JAVA_HOME"="/opt/jdk_x64/jdk-17.0.2+8/Contents/Home")
由于软件升级,安装包的名字可能会变, 所以不能直接照抄。
第七步:安装XQuartz。打开https://www.xquartz.org/
XQuartz目前是2.8.1版本,安装时会注销,parallel Desktop里的MacOS安装的Xquartz,可能无法被调用。
第八步: R包安装配置。打开
~/.Rprofile
添加清华镜像options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")
-
如何用R语言做线性回归?
2020-12-31 00:18:51说明:斜体为R语言代码01数据准备:下载数据集在进行线性回归模拟之前,我们需先准备具有线性关系的数据集。这里以机械工业出版社出版出版的丘祐玮著的《数据科学:R语言实现 (数据科学与工程技术丛书)》中的房屋...说明:斜体为R语言代码
01数据准备:下载数据集
在进行线性回归模拟之前,我们需先准备具有线性关系的数据集。
这里以机械工业出版社出版出版的丘祐玮著的《数据科学:R语言实现 (数据科学与工程技术丛书)》中的房屋租赁数据集为例,数据下载网址为https:// raw. GitHubusercontent. com/ ywchiu/ rcookbook/ master/ chapter11/ house_ rental. csv。
从该网页下载的数据需转存到R语言可读取格式的文件中。这里我们以csv文件格式为例,进行介绍,将数据集存储为house_rental.csv。
注:以上网页数据若直接粘贴至excel文件再转存为csv文件时,不能分列粘贴,需要将数据按分隔符“,”分列,将每列数据存储在不同的列中。
或者可以关注后,在后台回复house_rental 获取分列存储的csv文件。
将上述文件存储在R的工作目录中,或者将R的工作目录设置为上述文件的存储路径。关于R工作目录的修改和查询见本公众号之前发布的文章:000 R工作目录
02读取csv文件
R读取csv文件的函数为 read.csv(‘文件名.csv’,header = TRUE)。
注:文件名需用英文单引号’’包围。
例:
> house
03用函数lm()拟合线性回归
函数lm()的使用形式为:lm(因变量~自变量, data)。
回归模型函数lm()可以响应~变量的形式。
例:拟合house_rental数据集中Price与Sqft变量的关系,其中Sqft为自变量,Price为因变量。
> lmfit
输出拟合结果:
> lmfit
Call:
lm(formula = Price ~ Sqft, data = house)
Coefficients:
(Intercept) Sqft
3425.13 38.33
输出结果显示:截距为3425.13,自变量Sqft对应的系数为38.33.即:Price=3425.13+38.33*Sqft
04画出趋势线
03中输出的拟合结果仅是函数表达式,为了更直观地观察Price和Sqft的关系,我们画出散点图和趋势线。
画散点图:
> plot(Price ~ Sqft, data = house)
输出结果:
画趋势线:使用函数abline(),该函数可以在当前图形上画出一条或多条直线。
> abline(lmfit, color = 'red')
输出结果:
05使用函数summary()获取格式化的拟合结果
> summary(lmfit)
Call:
lm(formula = Price ~ Sqft, data = house)
Residuals:
Min 1Q Median 3Q Max
-76819 -12388 -3093 10024 112227
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3425.133 1766.646 1.939 0.053 .
Sqft 38.334 1.034 37.090 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 20130 on 643 degrees of freedom
Multiple R-squared: 0.6815, Adjusted R-squared: 0.681
F-statistic: 1376 on 1 and 643 DF, p-value: < 2.2e-16
在决定拟合模型是否可行时,我们主要看拟合的截距Intercept和自变量系数对应的p-value(Pr)。
根据显著性水平(一般取0.05或0.01),若p-value小于既定的显著性水平(此例中p-value: < 2.2e-16 < 0.01),说明拒绝原假设H0(斜率为0),接受备择假设(此例中为斜率为38.3340)。
也可以根据显著性水平检验结果——确定性系数R^2判定模型拟合的优劣,一元线性回归中R方等于皮尔逊积矩相关系数(Pearson product moment correlation coefficient 或Pearson's r)的平方。这种方法计算的R方一定介于0~1之间的正数,该数值越接近于1,说明拟合效果越理想。在一般问题中,R-squared达到0.8以上,回归模型即可接受。
此例中的Multiple R-squared为0.6815,虽然拟合结果没有特别理想,但也可以接受,另外,根据p-value,拟合结果也可以接受。
degrees of freedom = n-2,此例中共有645条数据。
06练习
可以使用某短视频网站话题数~视频数数据练习线性回归模型。
在后台回复‘topic_video’获取对应csv数据集。
-
R语言实现SVM预测的代码
2018-08-31 09:36:45R语言实现SVM预测的代码,简单但是亲测可用。(下载后用记事本打开即可) library(xlsx) library(e1071) #———— 1、加载数据 #训练集 #预测集 #———— 2、数据整理 #建立模型 #预测 -
R语言 神经网络
2017-12-24 16:22:14R语言 神经网络,利用r语言做前馈反向传播神经网络算法 -
基于R语言的时间序列分析以及garch模型拟合
2019-07-12 18:37:22里面包含数据集,R语言代码,代码后面也写了注释,清晰易懂 -
R语言_差异表达分析
2017-10-21 22:31:08介绍R语言用于统计分析差异表达,来源课程内部讲义,注重实战!