精华内容
下载资源
问答
  • r语言数据统计分析(含代码、数据和论文报告),对20年的人口数据进行线性回归拟合,通过对模型的改进,预测未来的人口。
  • R语言大作业(全国2000-2019年人口各项数据分析)

    万次阅读 多人点赞 2020-06-16 18:54:59
    综合运用本学期所学统计学理论知识、R语言编程技巧和数据分析案例等内容,根据个人兴趣点,自行收集数据、整理数据、展示数据、分析数据,挖掘数据价值。能够正确合理使用R语言实现数据分析,并将此案例整理成数据...

    数据是统计局下载的,为期末大作业做准备。
    数据要存成csv模式,好导入到RGui中
    在这里插入图片描述
    年份,人口出生率,人口死亡率,人口自然增长率
    2000,1.403,0.645,0.758
    2001,1.338,0.643,0.695
    2002,1.286,0.641,0.645
    2003,1.241,0.64,0.601
    2004,1.229,0.642,0.587
    2005,1.24,0.651,0.589
    2006,1.209,0.681,0.528
    2007,1.21,0.693,0.517
    2008,1.214,0.706,0.508
    2009,1.195,0.708,0.487
    2010,1.19,0.711,0.479
    2011,1.193,0.714,0.479
    2012,1.21,0.715,0.495
    2013,1.208,0.716,0.492
    2014,1.237,0.716,0.521
    2015,1.207,0.711,0.496
    2016,1.295,0.709,0.586
    2017,1.243,0.711,0.532
    2018,1.094,0.713,0.381
    2019,1.048,0.714,0.334
    (数据自行复制吧)

    一、任务目的:

    综合运用本学期所学统计学理论知识、R语言编程技巧和数据分析案例等内容,根据个人兴趣点,自行收集数据、整理数据、展示数据、分析数据,挖掘数据价值。能够正确合理使用R语言实现数据分析,并将此案例整理成数据分析报告。

    二、任务要求:

    1.数据描述性统计(平均数、标准差、中位数、偏态程度),体现数据特征,并对重要数据变量进行图表展示。
    2.数据分析:明确通过数据分析要解决什么问题,运用什么分析思路、分析方法和模型,并最终得出总结性的结论或效果。
    3.分析过程中,根据数据特征,解释为什么使用某某函数进行运算求解,并对运算得到的相关参数进行解读。
    例如:参数估计时,数据总体服从正态分布σ未知,样本量<30,属小样本,样本均值经标准化后服从自己度为n-1的t分布,故采用t.test函数……
    假设检验时,需写明具体“假设”、结论及相应代码。
    建模时,需明确具体步骤,对建模参数进行解读

    数据描述性统计

    在这里插入图片描述在这里插入图片描述在这里插入图片描述

    绘制带有箱线图、轴须线和密度估计的直方图

    在这里插入图片描述

    在这里插入图片描述在这里插入图片描述在这里插入图片描述

    核密度图

    在这里插入图片描述
    人口出生率:
    在这里插入图片描述
    人口死亡率:
    在这里插入图片描述
    人口自然增长率:
    在这里插入图片描述

    时间序列图

    在这里插入图片描述
    在这里插入图片描述

    数据分析

    1. 确定变量间的关系
      首先出生率和死亡率:
      在这里插入图片描述在这里插入图片描述
      人口出生率下降,人口死亡率在增长,二者的观测点分布在一条直线的周围,因而具有负线性关系。两个箱线图显示,出生率和死亡率不是对称分布。从拟合的曲线来看,有一定的线性特征,可以认为两个变量有线性关系。
      其次是出生率和自然增长率
      代码同上
      在这里插入图片描述
      人口出生率增加,人口自然增长率也在增长,二者的观测点分布在一条直线的周围,因而具有正的线性相关关系。两个箱线图显示,出生率和死亡率有一定的对称分布。从拟合的曲线来看,非线性特征不明显,显示两个变量有线性关系。
      最后是死亡率和自然增长率
      在这里插入图片描述
      人口死亡率减少,人口自然增长率在增长,二者的观测点分布在一条直线的周围,因而具有负的线性相关关系。两个箱线图显示,出生率和死亡率不是对称分布。从拟合的曲线来看,线性特征不是很明显,显示两个变量没有较强线性关系。
    2. 有关于相关系数的计算与检验
      在这里插入图片描述
    3. 回归模型与回归方程

    在这里插入图片描述在这里插入图片描述

    arrows 函数用来在一张图表上添加箭头,只需要分别指定起始坐标和终止坐标,就可以添加箭头了,还可以通过一些属性对箭头的形状,大小进行调整.``
    xo, yo 指定起始点的x和y坐标,x1, y1 指定终止点的x和y坐标

    arrows(x0 = 1, y0 = 1, x1 = 4, y1 = 4)
    

    x0, y0,x1,y1 支持一次设置多个值,同时画多个箭头

    arrows(x0 = c(1, 1),  y0 = c(1, 2),  x1 = c(4, 4), y1 = c(4, 5))
    

    length : 该参数一次只能设置一个值,默认值为0.25, 为了调整不同箭头的大小,建议分别设置

    par(mfrow = c(1,3))
    plot(1:5, 1:5, xlim = c(0,6), ylim = c (0,6), type = "n", main = "length = 0.1")
    arrows(x0 = 1, y0 = 1, x1 = 4, y1 = 4, length = 0.1)
    plot(1:5, 1:5, xlim = c(0,6), ylim = c (0,6), type = "n", main = "length = 0.5")
    arrows(x0 = 1, y0 = 1, x1 = 4, y1 = 4, length = 0.5)
    plot(1:5, 1:5, xlim = c(0,6), ylim = c (0,6), type = "n", main = "length = 1")
    arrows(x0 = 1, y0 = 1, x1 = 4, y1 = 4, length = 1)
    

    效果图
    在这里插入图片描述code : 调整箭头的类型,一共有1,2,3,4 共四种类型,该参数一次只能设置一个值

    par(mfrow = c(1,3))
    plot(1:5, 1:5, xlim = c(0,6), ylim = c (0,6), type = "n", main = "code = 1")
    arrows(x0 = 1, y0 = 1, x1 = 4, y1 = 4, code = 1)
    plot(1:5, 1:5, xlim = c(0,6), ylim = c (0,6), type = "n", main = "code = 2")
    arrows(x0 = 1, y0 = 1, x1 = 4, y1 = 4, code = 2)
    plot(1:5, 1:5, xlim = c(0,6), ylim = c (0,6), type = "n", main = "code = 3")
    arrows(x0 = 1, y0 = 1, x1 = 4, y1 = 4, code = 3)
    

    效果图
    在这里插入图片描述angle : 设置箭头的角度,默认值是45,该参数一次只能设置一个值

    par(mfrow = c(1,3))
    plot(1:5, 1:5, xlim = c(0,6), ylim = c (0,6), type = "n", main = "angle = 15")
    arrows(x0 = 1, y0 = 1, x1 = 4, y1 = 4, length = 0.5, angle = 15)
    plot(1:5, 1:5, xlim = c(0,6), ylim = c (0,6), type = "n", main = "angle = 45")
    arrows(x0 = 1, y0 = 1, x1 = 4, y1 = 4, length = 0.5, angle = 45)
    plot(1:5, 1:5, xlim = c(0,6), ylim = c (0,6), type = "n", main = "angle = 60")
    arrows(x0 = 1, y0 = 1, x1 = 4, y1 = 4, length = 0.5, angle = 60)
    

    效果图
    在这里插入图片描述除了上面的针对arrows 的特殊参数之外,也支持一些通用的参数,col , lty ,lwd 等

    出生率和自然增长率
    在这里插入图片描述
    死亡率和自然增长率
    在这里插入图片描述

    模型的拟合优度(以出生率和死亡率为例)

    在这里插入图片描述
    出生率和死亡率的决定系数R^2=0.3447=34.47%表示在人口出生率的取值的总误差中有34.47%可以由人口出生率与死亡率之间的线性关系来解释,可见模型的拟合程度较低

    残差的标准误

    出生率和死亡率的残差标准误是0.06245,表示用死亡率来预测出生率时平均的预测误差为6.245%

    模型显著检验——线性关系检验(F检验)

    #H0:不显著;H1:显著
    #F=9.469 p=0.006496<0.05拒绝原假设,线性关系显著

    回归系数检验与推断

    出生率和死亡率
    H0:β1=0(自变量对因变量的影响不显著);H1:β2≠0(显著)
    t=-3.077 p=0.0065<0.05,拒绝原假设,自变量对因变量的影响显著

    利用回归方程进行预测

    #计算点预测值(pre_model)、置信区间(con_int)和预测区间(pre_int)
    model<-lm(人口出生率~人口死亡率,data=table)
    x0<-table$人口死亡率
    pre_model<-predict(model)
    con_int<-predict(model,data.frame(人口死亡率=x0),interval="confidence",level=0.95)
    pre_int<-predict(model,data.frame(人口死亡率=x0),interval="prediction",level=0.95)
    pre<-data.frame(人口出生率=table$人口出生率,点预测值=pre_model,置信下限=con_int[,2],置信上限=con_int[,3],预测下限=pre_int[,2],预测上限=pre_int[,3])
    pre
    

    在这里插入图片描述

    回归模型诊断

    #计算预测值(pre)、残差(res)和标准化残差(zre)(出生率,死亡率)
    model<-lm(人口出生率~人口死亡率,data=table)
    pre<-fitted(model)
    res<-residuals(model)
    zre<-model$residuals/(sqrt(deviance(model)/df.residual(model)))
    mysummary<-data.frame(人口出生率=table$人口出生率,点预测值=pre,残差=res,标准化残差=zre)
    mysummary
    
    

    在这里插入图片描述

    检验线性关系

    #成分残差图
    model_1<-lm(人口出生率~人口死亡率,data=table)
    library(car)
    par(mai=c(.7,.7,.1,.1),cex=.8)
    crPlots(model_1)#线性
    #检验正态性
    par(mfrow=c(2,2),cex=0.8,cex.main=0.7)
    plot(model_1)
    #检验方差齐性
    library(car)
    ncvTest(model_1)
    #绘制散布—水平图
    spreadLevelPlot(model_1)
    #检验残差独立性
    library(car)
    durbinWatsonTest(model_1)
    

    在这里插入图片描述
    残差成分图,横坐标是自变量的实际观测值,纵坐标是因变量与残差之和,从拟合的曲线可以看出,人口出生率和死亡率没有过于明显的非线性模式,说明二者的线性关系假定成立。
    在这里插入图片描述
    右上角的图是标准化残差的正太Q-Q图,用于检验残差的正态性假定,可以看出,各个点大部分都在直线周围随机分布,没有固定模制,因此,出生率和死亡率的线性模型中,ε正态性的假定基本成立。
    左上角的图是残差值与拟合值图
    左下角的图是位置尺度图
    右下角图是残差与杠杆图,用于鉴别样本数据是否有离群点、高杠杆点和强影响点 。
    在这里插入图片描述

    方差齐性检验的原假设为误差项满足方差齐性p=0.98995接受原假设,可以认为满足方差齐性。
    在这里插入图片描述
    该图非线性特征明显,所以不满足方差齐性的假定
    在这里插入图片描述
    原假设为残差无自相关 p=0,拒绝原假设,显示残差有自相关

    展开全文
  • 本文对人口统计预测方法进行讨论。首先,我们将看到基本的静态方法。

    原文链接:http://tecdat.cn/?p=18079

    原文出处:拓端数据部落公众号

    本文对人口统计预测方法进行讨论。首先,我们将看到基本的静态方法。在使用数据集之前,我们使用“标准” 生命表

    
    download.file(url,"mortal")
    tables=readHTMLTable("morta

    下面是获取数据集的代码

    tables[[2]]
    a1=as.numeric(as.character(TV8[,1]))
    a2=as.numeric(as.cha
    TV0=data.frame(x=c(a1,a2),lx=as.numeric(c(b1,b2))

    可以使用生存函数来计算出生时的期望寿命

    sum(TV0$lx)/100000-1
    [1] 72.01518

    可视化的生存概率

     

    或死亡概率,即假设您达到xx岁,则在某特定年龄xx死亡的概率,也称为 死亡率

    n=nrow(TV0)
    px=(TV8$lx[1:(n-1)]-TV8$lx[2:n])/
    TV8$lx[1:

    使用对数概率的可视化

    plot(x,px,type="l",log="y")

    最后,我们可以计算死亡年龄的概率密度

    用来计算期望寿命

    sum(x*pbx)
    [1] 72.01518

    对于初始数据,我们可以使用人类死亡率数据库中的表格。

    
    download.file(url,"E.txt")

    以下代码可用于读取这些文件。

    read.table("C.txt",skip = 3,header=TRUE)
    
          Year  Age Female  Male  Total
    22195 2015  101 242.66 25.86 323.82
    22196 2015  104 132.95 16.39 213.34
    22197 2015  101 101.87 9.50 145.37
    22198 2015  103  57.27  4.07  64.34
    22199 2015  109  31.93  2.59  32.52
    22200 2015 110+  33.03  1.61  33.64

    专栏

    精算科学

    关于结合数学、统计方法以及程序语言对经济活动来做风险分析、评估的见解。

    探索专栏 

    展开全文
  • 故需要将其转化为R语言能够识别的缺失值,并对其删除。 (3) 缺失值处理 #将原数据的问号替换为缺失值,注意问号前有1个空格 adult$workclass[adult$workclass==" ?"]$occupation[adult$occupation==" ?"]$native....

    一、数据集介绍

    数据来源于UCI数据库,网址为adult数据集(下载下来是dat文件,可以用txt文本打开)。该数据集共32560条数据,15个变量,具体变量名及含义如下表所示。

    变量名含义类型
    age年龄数值型
    workclass工作类型类别型
    fnlwgt编号数值型
    education受教育程度类别型
    education.num受教育时间数值型
    marital.status婚姻状况类别型
    occupation职位类别型
    relationship家庭关系类别型
    race种族类别型
    sex性别类别型
    capital.gain资本收益数值型
    capital.loss资本损失数值型
    hours.per.week每周工作小时数值型
    native.country原籍类别型
    class收入阶层类别型(>50K和<50K)

    二、数据预处理

    (1)    数据读取

    setwd("C:/Users/dell/Desktop")
    rm(list=ls())
    #读取数据
    adult<-read.table("adult.txt",header=T,sep=",")
    #添加变量名
    colname<-c("age","workclass","fnlwgt","education","education.num",
               "marital.status","occupation","relationship",
               "race","sex","capital.gain","capital.loss","hours.per.week",
               "native.country","class")
    colnames(adult)<-colname
    
    #连续变量
    varcontinue <- c("age","fnlwgt","education.num","capital.gain","capital.loss","hours.per.week")  
    #连续变量转化为数值型并与因子型变量合并
    adult <- cbind(lapply(adult[,varcontinue],function(x) as.numeric(as.character(x))),adult[,setdiff(colname,varcontinue)]) 
    str(adult)  #查看各变量类型
    

    在这里插入图片描述
    为方便后续分析,各类别型变量已转为因子型。

    (2)   缺失值识别

    sum(is.na(adult))   #查看缺失值情况
    #尝试观察是否存在非NA型缺失值
    table(adult$workclass)
    table(adult$occupation)
    table(adult$native.country)
    

    在这里插入图片描述
    首先,对原数据集利用is.na函数判断是否存在NA型缺失值,结果发现并没有。但是,从workclass、occupation、native.country这三个因子型变量的统计来看,都含有"?"。故需要将其转化为R语言能够识别的缺失值,并对其删除。

    (3)   缺失值处理

    #将原数据的问号替换为缺失值,注意问号前有1个空格
    adult$workclass[adult$workclass==" ?"]<-NA
    adult$occupation[adult$occupation==" ?"]<-NA
    adult$native.country[adult$native.country==" ?"]<-NA
    
    #观察是否替换成功
    table(adult$workclass)
    table(adult$occupation)
    table(adult$native.country)
    
    #删除缺失值,生成新数据
    adult1<-na.omit(adult)
    
    print(nrow(adult))   #原数据总条数
    print(nrow(adult1)) #现数据总条数
    print(nrow(adult)-nrow(adult1)) #缺失值条数 
    

    在这里插入图片描述
    从上图可知,?已完全删除。删除缺失值后,查看新的数据总条数如下所示
    在这里插入图片描述
    从结果来看,缺失值共2399条。

    三、描述型统计分析

    以下以收入阶层class为研究中心,探究不同因素下群体收入是否存在显著差异。
    (1)   探究不同教育程度的收入等级差异

    library(ggplot2)      
    library(Rmisc)           # multiplot(多图绘制)
    
    # 封装绘图函数
    # data:数据源,xlab:x轴数据,fillc:填充颜色,pos:调整位置,xname:x轴标签文本,yname:y轴标签文本
    fun_bar <- function(data, xlab, fillc, pos, xname, yname) {
      ggplot(data, aes(xlab, fill = fillc)) + 
        geom_bar(position = pos) +
        labs(x = xname, y = yname) +
        coord_flip() +       # 使图形倒置
        theme_minimal()      # ggplot图形的一种背景主题
    }
    ## 探索不同教育程度的群体的收入等级(pos=‘stack’指定使用堆积条形图)
    p1 <- fun_bar(data = adult1, xlab = adult1$education, fillc = adult1$class, 
                  pos = 'stack',  xname = 'education', yname = 'count')
                  
    ## 探索不同教育程度的群体的收入等级(pos=‘fill’指定使用百分比堆积条形图)
    p2 <- fun_bar(data = adult1, xlab = adult1$education, fillc = adult1$class, 
                  pos = 'fill',  xname = 'education', yname = 'per count')
    
    

    从图中来看,学历对收入阶层的影响的确是有一定作用。例如,对于硕士(master)和博士(Doctorate)来说,收入>50K的群体明显要多一些。此外,还有Prof-school(专门学院)大部分群体工资也都在50K以上。(主要培养职业型人才,一开始我以为是技校hhh。百度才知道这种学院出来的人才是社会的精英,具备高薪和崇高的社会地位)

    (2)   探索受教育年限对收入的影响

    p3 <- fun_bar(data = adult1, xlab = adult1$education.num, fillc = adult1$class,
                  pos = 'stack', xname = 'education.num', yname = 'count')
    
    p4 <- fun_bar(data = adult1, xlab = adult1$education.num, fillc = adult1$class,
                  pos = 'fill', xname = 'education.num', yname = 'per count')
    multiplot(p3,p4,cols = 1)
    

    不难看出,受教育年限越长,收入>50k的群体占比越大。

    (3)   探究婚姻状况对收入的影响

    p5 <- fun_bar(data = adult1, xlab = adult1$marital.status, fillc = adult1$class,
                  pos = 'stack', xname = 'marital.status', yname = 'count')
    p6 <- fun_bar(data = adult1, xlab = adult1$marital.status, fillc = adult1$class,
                  pos = 'fill', xname = 'marital.status', yname = 'per count')
    multiplot(p5, p6,cols = 1)
    

    可以发现,married-civ-spouse(已婚平民配偶)和married-AF-spouse(已婚军属)类型的收入>50k群体占比大。

    (4)   探究性别、年龄、受教育年限、每周工作时间与收入关系

    bar_sex <- fun_bar(data = adult1, xlab = adult1$sex, fillc = adult1$class,
                           pos = 'fill', xname = 'sex', yname = 'per count')
                        
    box_age <- ggplot(adult1, aes(x = class, y = age ,fill = class))+
      geom_boxplot()+theme_bw()+labs(x = 'class', y = 'age')
    
    box_edu <- ggplot(adult1, aes(x = class, y = education.num ,fill = class))+
      geom_boxplot()+theme_bw()+labs(x = 'class', y = 'education.num')
    
    box_work <- ggplot(adult1, aes(x = class, y = hours.per.week ,fill = class))+
      geom_boxplot()+theme_bw()+labs(x = 'class', y = 'hours.per.week')
    
    multiplot(bar_sex,box_age, box_edu, box_work, cols = 2)
    

    从图中大致可以发现,收入高的群体一般男性居多、年龄较大、每周工作时间较长、受教育年限较长。

    四、机器学习及模型比较

    (1)   构建训练集和测试集

    train=sample(1:nrow(adult1),0.7*nrow(adult1))
    adult1_train <- adult1[train,]
    adult1_test <- adult1[-train,]
    

    (2)    随机森林分析

    library(randomForest)
    library(caret)           # confusionMatrix
    #建立随机森林模型进行预测,并可视化重要变量
    set.seed(1234)
    #首先在训练集上训练,并剔除序号fnlwgt变量
    rf_model <- randomForest(class ~.-fnlwgt, data = adult1_train, importance =T)
    pred_rf <- predict(rf_model, adult1_train, type = 'class')
    varImpPlot(rf_model)    #绘制变量重要性曲线
    confusionMatrix(pred_rf, adult1_train$class)   #混淆矩阵
    

    左图显示的是平均减少的准确率,右图显示的是平均减少的基尼系数。以左图为例,其中每个点即代表移除相应的特征后平均减少的准确率,故越高的变量越重要。不难看出,caption.gain(资本增值)、occpation(职业)较为重要。输出的混淆矩阵如下所示:
    在这里插入图片描述
    从结果不难看出,随机森林在训练集上准确率为93.15%,共有15341+4324个样本判断正确,473+974个样本判断错误。

    以下,再在测试集上进行验证:

    pred_rf_test <- predict(rf_model, adult_test, type = 'class')
    confusionMatrix(pred_rf_test, adult1_test$class) 
    

    在这里插入图片描述
    测试集上准确率为86.27%,共有6347+1460个样本判断正确,750+492个样本判断错误。

    (3)    SVM分析

    library(kernlab)         # ksvm()
    library(caret)           # confusionMatrix
    # 建立支持向量机模型(kernel='rbfdot'指定使用径向基函数)
    set.seed(1234)
    #剔除变量fnlwgt,在训练集上训练
    svm_model <- ksvm(class ~.-fnlwgt, data = adult1_train, kernel = 'rbfdot')
    pred_svm <- predict(svm_model, adult1_train, type = 'response')
    confusionMatrix(pred_svm, adult1_train$class) 
    

    在这里插入图片描述
    SVM在训练集上准确率为86.22%,共有14898+3305个样本判断正确,1933+916个样本判断错误。

    以下,再在测试集上进行验证:

    pred_svm_test <- predict(svm_model, adult1_test, type = 'response')
    confusionMatrix(pred_svm_test, adult1_test$class) 
    

    在这里插入图片描述
    SVM在测试集上准确率为85.74%,共有6402+1357个样本判断正确,437+853个样本判断错误。

    (4)    模型比较(ROC曲线)
    单从准确率的角度来看,随机森林的确要高一些,但在训练集和测试集上的准确率差别相比SVM在训练集和测试集的准确率差别更大一些。以下,将从ROC曲线的角度来判断两者模型优劣。

    library(pROC)
    #roc()函数适用于数值型数据,所以需要数据类型转换
    red_rf_test<-as.numeric(pred_rf_test)
    pred_svm_test<-as.numeric(pred_svm_test)
    adult1_test$class <-as.numeric(adult1_test$class)
    par(mfrow=c(1,2))
    roc(pred_rf_test,adult1_test$class, plot=TRUE, print.thres=TRUE, print.auc=TRUE,main="随机森林ROC")
    roc(pred_svm_test,adult1_test$class, plot=TRUE, print.thres=TRUE, print.auc=TRUE,main="支持向量机ROC")
    

    从AUC的值来看,随机森林较SVM稍好一点,但相差并不大。

    展开全文
  • r语言基础教程(觉得干货!):r语言基础知识 本次数据分析案例结合全国人口数据,首先进行线性回归分析,分析模型的拟合优度,再通过线性回归模型预测未来人口。 本文完整论文报告下载地址(附代码和数据):人口...

    其他数据分析案例看我的另一篇文章:中国疫情数据分析与预测
    r语言基础教程(觉对干货!):r语言基础知识

    本次数据分析案例结合全国人口数据,首先进行线性回归分析,分析模型的拟合优度,再通过线性回归模型预测未来人口。需要代做加QQ1975728171

    部分展示:
    数据来源:国家统计局
    下载最近20年的人口年度数据,包括年末总人口(万人)、男性人口(万人)、女性人口(万人)、城镇人口(万人)、农村人口(万人)。
    在这里插入图片描述
    (1)绘图
    year=rep(2020:2001)
    plot(data$V2[-1]~year,col=‘red’,xlab=‘年份’,ylab=‘总人口(万人)’,main = “中国年末总人口(2001-2020)”)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 人口金字塔是进行人口数据可视化时常用的一种统计图形,可以形象地描述人口年龄和性别的分布情况。最近工作上经常处理人口数据,于是试着使用ggplot2绘制了一下。在这里记录一下,顺便也熟悉一下ggplot2的用法。 ...
  • R语言数据地图

    千次阅读 多人点赞 2020-02-28 14:51:15
    R语言:绘制新冠肺炎数据地图世界地图的绘制中国地图的绘制方法一:方法二: 数据地图是一种经典的图示方法,因此 世界地图的绘制 R包中存储着常见地图的数据,比如maps包中包含世界地图、美国地图等 library(maps) ...
  • 1975-2011年的数据中。 1)分别统计每年人口最多的国家是哪个?有多少 2)统计出各个国家的1975-2011年的平均人口增长率 3)统计每年人口最多的十个国家 4)统计出每年人口最少的十个国家 5)结合洲的语言的分类...
  • 本文我们讨论了期望寿命的计算。人口统计模型的起点是死亡率表。但是,这种假设有偏差,因为它假设生活条件不会得到改善。为了正确处理问题,我们使用了更完整的数据,其中死亡人数根据x岁而定,还包括日期t。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 6,163
精华内容 2,465
关键字:

r语言人口数据