精华内容
下载资源
问答
  • r语言自带数据集
    千次阅读
    2020-03-18 16:39:06

    R基础


    例如:获取R机器学习常用包的mlbench内置的数据集和文本描述

    输入

    library(mlbench)
    print(data(package="mlbench")) #实际操作mlbench改为所需package名
    

    输出

    Data sets in package ‘mlbench’:
    
    BostonHousing                    Boston Housing Data
    BostonHousing2                   Boston Housing Data
    BreastCancer                     Wisconsin Breast Cancer Database
    DNA                              Primate splice-junction gene sequences (DNA)
    Glass                            Glass Identification Database
    HouseVotes84                     United States Congressional Voting Records 1984
    Ionosphere                       Johns Hopkins University Ionosphere database
    LetterRecognition                Letter Image Recognition Data
    Ozone                            Los Angeles ozone pollution data, 1976
    PimaIndiansDiabetes              Pima Indians Diabetes Database
    PimaIndiansDiabetes2             Pima Indians Diabetes Database
    Satellite                        Landsat Multi-Spectral Scanner Image Data
    Servo                            Servo Data
    Shuttle                          Shuttle Dataset (Statlog version)
    Sonar                            Sonar, Mines vs. Rocks
    Soybean                          Soybean Database
    Vehicle                          Vehicle Silhouettes
    Vowel                            Vowel Recognition (Deterding data)
    Zoo                              Zoo Data
    
    更多相关内容
  • R语言数据包自带数据集之ToothGrowth数据集字段解释、数据导入实战 目录 R语言数据包自带数据集之ToothGrowth数据集字段解释、数据导入实战 #数据字段说明 #导入包 #导入数据 #数据字段说明 ...

    R语言数据包自带数据集之ToothGrowth数据集字段解释、数据导入实战

    目录

    R语言数据包自带数据集之ToothGrowth数据集字段解释、数据导入实战

    #数据字段说明

    #导入包

    #导入数据



    #数据字段说明

    ToothGrowth为R内置数据集。

    它包含一项评估维生素C对豚鼠牙齿生长的影响的研究数据。

    实验在60只豚鼠上进行,其中每只豚鼠通过两种递送方法(橙汁,OJ,或抗坏血酸,VC)分别接受三种剂量水平的维生素C量(0.5、1和2 mg /天, VC)。

    实验者测量了牙齿生长的长度。

    牙齿生长数据集包含了研究维生素C对60只豚鼠牙齿生长影响的实验结果。每只动物通过两种给药方法(橙汁或抗坏血酸(一种维生素C,编码为VC)中的一种,接受三种剂量水平的维生素C(0.5、1和2 mg/天)。

    #导入包

    # 导入R内自带的ToothGrowth数据集
    library(datasets)
    data(ToothGrowth)

    #导入数据

    str(ToothGrowth)
    head(ToothGrowth)


    A data frame with 60 observations on 3 variables.

    [,1]lennumericTooth length
    [,2]suppfactorSupplement type (VC or OJ).

    参考:R

    参考:ToothGrowth: The Effect of Vitamin C on Tooth Growth in Guinea Pigs

    参考:基础-R内置数据集

    参考:[R语言]dataset数据包信息汇总

    展开全文
  • R语言数据包自带数据集之survival包的lung数据集字段解释、数据导入实战 目录 R语言数据包自带数据集之survival包的lung数据集字段解释、数据导入实战 #数据字段说明 #导入包 #导入数据 #数据字段说明...

    R语言数据包自带数据集之survival包的lung数据集字段解释、数据导入实战

    目录

    R语言数据包自带数据集之survival包的lung数据集字段解释、数据导入实战

    #数据字段说明

    #导入包

    #导入数据


    #数据字段说明

    survival包的lung数据集

    lung数据集:NCCTG晚期肺癌患者的生存率。
    inst # 机构代码;
    time # 生存天数;
    status # 生存状态,1为删失,2为死亡;
    age # 年龄;sex # 性别,1为男性,2为女性;
    ph.ecog、ph.karno、pat.karno # 为病人和患者评分;
    meal.cal # 进食时消耗的卡路里;
    wt.loss # 最近6个月内的体重下降。

    inst:机构代码
    time:以天为单位的生存时间
    status:删失状态1 = 删失,2 = 出现失效事件
    age:岁
    sex:性别,男= 1女= 2
    ph.ecog:ECOG评分(0 =好,5 =死)
    ph.karno:医师进行的Karnofsky评分(0 = 差,100 = 好)
    pat.karno:患者自行进行的Karnofsky评分(0 = 差,100 = 好)

    meal.cal:用餐时消耗的卡路里
    wt.loss:最近六个月的体重减轻

    #导入包

    # install.packages("survminer")
    # install.packages("survival")
    library(survminer)
    library(survival)

    #导入数据

    #导入数据集
    #使用R语言survival包中的lung数据集
    str(lung)
    head(lung)


    A dataset consisting of 137 observations with their survival time, censor status as well as 6 features.

    x

    x contains 6 columns of the following variables: trt (1=standard treatment, and 2=test); celltype (1=squamous, 2=smallcell, 3=adeno, and 4=large); karno (Karnofsky performance score); diagtime (months from diagnosis to randomization); age (in years); prior (prior therapy 0=no, and 1=yes)

    time

    survival time

    status

    censor status

    参考:R

    参考:lung.data: Dataset for coxpath

    展开全文
  • R语言自带基本数据集简介

    万次阅读 2019-09-25 11:02:13
    在用R语言数据分析的时候,我们经常需要一些数据做实验,尤其当学会一个新的方法或者算法的时候,就想赶快编程实现一下。那么,问题来了,用什么数据好呢,什么样的数据适合做这种...

    0?wx_fmt=jpeg

    0?wx_fmt=png

    在用R语言做数据分析的时候,我们经常需要一些数据做实验,尤其当学会一个新的方法或者算法的时候,就想赶快编程实现一下。那么,问题来了,用什么数据好呢,什么样的数据适合做这种实验呢?


    好在R语言提供了很多的基本数据集,这些基本数据集是可以直接加载、可以完成几乎所有的数据分析任务模拟数据的。这都是些哪些种类的数据呢?


    这些基本数据集都在R包datasets里面,可以执行命令:

    > data(package = 'datasets')

    就会datasets包带的出现所有基本基本数据集:


    0?wx_fmt=png


    具体翻译一下各个数据集基本情况



    向量
    euro    #欧元汇率,长度为11,每个元素都有命名
    landmasses    #48个陆地的面积,每个都有命名
    precip    #长度为70的命名向量
    rivers    #北美141条河流长度
    state.abb    #美国50个州的双字母缩写
    state.area    #美国50个州的面积
    state.name    #美国50个州的全称


    因子
    state.division    #美国50个州的分类,9个类别
    state.region    #美国50个州的地理分类


    矩阵、数组
    euro.cross    #11种货币的汇率矩阵
    freeny.x    #每个季度影响收入四个因素的记录
    state.x77    #美国50个州的八个指标
    USPersonalExpenditure    #5个年份在5个消费方向的数据
    VADeaths    #1940年弗吉尼亚州死亡率(每千人)
    volcano    #某火山区的地理信息(10米×10米的网格)
    WorldPhones    #8个区域在7个年份的电话总数
    iris3    #3种鸢尾花形态数据
    Titanic    #泰坦尼克乘员统计
    UCBAdmissions    #伯克利分校1973年院系、录取和性别的频数
    crimtab    #3000个男性罪犯左手中指长度和身高关系
    HairEyeColor    #592人头发颜色、眼睛颜色和性别的频数
    occupationalStatus    #英国男性父子职业联系


    类矩阵
    eurodist    #欧洲12个城市的距离矩阵,只有下三角部分
    Harman23.cor    #305个女孩八个形态指标的相关系数矩阵
    Harman74.cor    #145个儿童24个心理指标的相关系数矩阵


    数据框
    airquality    #纽约1973年5-9月每日空气质量
    anscombe    #四组x-y数据,虽有相似的统计量,但实际数据差别较大
    attenu    #多个观测站对加利福尼亚23次地震的观测数据
    attitude    #30个部门在七个方面的调查结果,调查结果是同一部门35个职员赞成的百分比
    beaver1    #一只海狸每10分钟的体温数据,共114条数据
    beaver2    #另一只海狸每10分钟的体温数据,共100条数据
    BOD    #随水质的提高,生化反应对氧的需求(mg/l)随时间(天)的变化
    cars    #1920年代汽车速度对刹车距离的影响
    chickwts    #不同饮食种类对小鸡生长速度的影响
    esoph    #法国的一个食管癌病例对照研究
    faithful    #一个间歇泉的爆发时间和持续时间
    Formaldehyde    #两种方法测定甲醛浓度时分光光度计的读数
    Freeny     #每季度收入和其他四因素的记录
    dating from     #配对的病例对照数据,用于条件logistic回归
    InsectSprays     #使用不同杀虫剂时昆虫数目
    iris    #3种鸢尾花形态数据
    LifeCycleSavings    #50个国家的存款率
    longley    #强共线性的宏观经济数据
    morley    #光速测量试验数据
    mtcars    #32辆汽车在11个指标上的数据
    OrchardSprays     #使用拉丁方设计研究不同喷雾剂对蜜蜂的影响
    PlantGrowth     #三种处理方式对植物产量的影响
    pressure     #温度和气压
    Puromycin     #两种细胞中辅因子浓度对酶促反应的影响
    quakes     #1000次地震观测数据(震级>4)
    randu     #在VMS1.5中使用FORTRAN中的RANDU三个一组生成随机数字,共400组。
    rock     #48块石头的形态数据
    sleep     #两药物的催眠效果
    stackloss     #化工厂将氨转为硝酸的数据
    swiss     #瑞士生育率和社会经济指标
    ToothGrowth     #VC剂量和摄入方式对豚鼠牙齿的影响
    trees    #树木形态指标
    USArrests    #美国50个州的四个犯罪率指标
    USJudgeRatings    #43名律师的12个评价指标
    warpbreaks    #织布机异常数据
    women    #15名女性的身高和体重


    列表
    state.center    #美国50个州中心的经度和纬度


    类数据框
    ChickWeight    #饮食对鸡生长的影响
    CO2    #耐寒植物CO2摄取的差异
    DNase    #若干次试验中,DNase浓度和光密度的关系
    Indometh    #某药物的药物动力学数据
    Loblolly    #火炬松的高度、年龄和种源
    Orange    #桔子树生长数据
    Theoph    #茶碱药动学数据


    时间序列数据
    airmiles    #美国1937-1960年客运里程营收(实际售出机位乘以飞行哩数)
    AirPassengers    #Box & Jenkins航空公司1949-1960年每月国际航线乘客数
    austres    #澳大利亚1971-1994每季度人口数(以千为单位)
    BJsales    #有关销售的一个时间序列
    BJsales.lead    #前一指标的先行指标(leading indicator)
    co2    #1959-1997年每月大气co2浓度(ppm)
    discoveries    #1860-1959年每年巨大发现或发明的个数
    ldeaths    #1974-1979年英国每月支气管炎、肺气肿和哮喘的死亡率
    fdeaths    #前述死亡率的女性部分
    mdeaths    #前述死亡率的男性部分
    freeny.y    #每季度收入
    JohnsonJohnson    #1960-1980年每季度Johnson & Johnson股票的红利
    LakeHuron    #1875-1972年某一湖泊水位的记录
    lh     #黄体生成素水平,10分钟测量一次
    lynx    #1821-1934年加拿大猞猁数据
    nhtemp     #1912-1971年每年平均温度
    Nile     #1871-1970尼罗河流量
    nottem     #1920-1939每月大气温度
    presidents     #1945-1974年每季度美国总统支持率
    UKDriverDeaths     #1969-1984年每月英国司机死亡或严重伤害的数目
    sunspot.month     #1749-1997每月太阳黑子数
    sunspot.year     #1700-1988每年太阳黑子数
    sunspots    #1749-1983每月太阳黑子数
    treering    #归一化的树木年轮数据
    UKgas    #1960-1986每月英国天然气消耗
    USAccDeaths    #1973-1978美国每月意外死亡人数
    uspop    #1790–1970美国每十年一次的人口总数(百万为单位)
    WWWusage    #每分钟网络连接数
    Seatbelts     #多变量时间序列。和UKDriverDeaths时间段相同,反映更多因素。
    EuStockMarkets    #多变量时间序列。欧洲股市四个主要指标的每个工作日记录,共1860条记录。




    当然了,如果我们想知道任意一个包自带有哪些数据集,可以有命令:

    > data(package = '包名')

    下面这样可以查看R所有包的数据情况,从下面参数all.available = TRUE也能猜出来。

    >data(package = .packages(all.available = TRUE))


    0?wx_fmt=png


    这样,就可以查看所有包自带的数据集情况了!

    0?wx_fmt=jpeg

    相见恨晚!

    展开全文
  • R语言数据包自带数据集之mtcars数据集字段解释、数据导入实战 目录 R语言数据包自带数据集之mtcars数据集字段解释、数据导入实战 #会用帮助?或者help函数 #字段说明 #导入包 #导入数据 Format Note ...
  • 许多 R 包中含有数据集,可以通过data函数查看或加载这些数据集,通过?获得数据集的帮助文档。基本数据集基本包 datasets含有 100 多个数据集R version 4.2.0),涉及医学、自然、社会学等各个领域。查看一下:...
  • 1.了解R语言中的数据结构。 2.熟练掌握他们的创建方法,和函数中一些参数的使用。 3.对创建的数据结构进行,排序、查找、删除等简单的操作。 1.向量的创建及因子的创建和查看 2.矩阵与数组。 3.将之前的state,数组...
  • 1.数据集使用指南、查看内置数据集包括哪些数据、通过直接输入名称进行数据集的引用 > help(package="datasets") > data() > AirPassengers 2.在命名时尽量不要与内置数据集内的数据名称相同,否则输入...
  • R语言与数据分析练习:创建和使用R语言数据集&数据的导入导出 实验一 创建和使用R语言数据集 一、实验目的: 了解R语言中的数据结构。 熟练掌握他们的创建方法,和函数中一些参数的使用。 对创建的数据...
  • R语言内置的常用数据集及相关简介

    千次阅读 2020-09-05 21:40:49
    R语言内置的常用数据集及相关简介前言查看数据集 前言 R语言提供了很多的基本数据集,这些基本数据集可以直接加载、可以完成几乎所有的数据分析任务模拟数据的。 查看数据集 这些基本数据集都在R包datasets里面,...
  • 一个闪亮的应用程序,使用 R 语言的 Titanic 数据集和相关的 Slidify 演示 泰坦尼克号闪亮应用程序: : 源代码(主分支): : Slidify 演示文稿: ://romain-jacottin.github.io/titanic 源代码( gh-pages ...
  • R语言数据包自带数据集之ISwR包的melanom数据集字段解释、数据导入实战 目录 R语言数据包自带数据集之ISwR包的melanom数据集字段解释、数据导入实战 #数据字段说明 #导入包 #导入数据 #数据字段说明...
  • R语言数据包自带数据集之survival包的colon数据集字段解释、数据导入实战 #数据字段说明 colon数据集:B/C期结肠癌辅助化疗治疗数据 d # 患者编号 study # 所有患者都是1 rx # 治疗方式,有三种:观察...
  • R语言内置数据集总结 提示:R语言中内置了很多数据集,有使用不同算法,不同统计模型的,我们在学习时可以只有自由调用,这样就省去了我们去找数据的时间,特此将一些数据集整理,方便日后查阅。 文章目录R语言内置...
  • 目录一、从键盘输入数据二、函数方法读取1.读取数据文件 2.从屏幕读取数据1.scan2.readline3. 读取固定宽度数据文件三、读取csv文件四、读取表格数据文件五、从网络中读取表格或者CSV数据文件 ​​​...
  • R语言内置了大量的数据集,我们可以拿来学习并用作测试, 这些数据集存储在R中datasets这个包中,这些数据收集于真实的调查数据 data函数可以访问这些数据集 想查看数据集除了可以直接敲数据集的名字显示数据...
  • 比如想从R中下载程序包lars中的diabetes数据 “C:/Users/dell/Desktop/diabetes.csv”是我想要保存的位置 library(lars) data(“diabetes”) write.csv(diabetes,file=“C:/Users/dell/Desktop/diabetes.csv”)
  • 本文简单总结了如何查看以及调用R语言的内置数据集
  • 引言 R语言基础包datasets里自带了一部分数据集合,为了大家更好的使用这些数据,这里从原子向量、因子、矩阵、数组、类矩阵、数据框、类数据框、列表、时间序列等9个方面做一些总结和介绍。大家可以通过data()命令...
  • R语言——三个数据集

    千次阅读 2020-08-15 15:51:01
    第一章数据概览(1)三个数据集1.1 uspop 数据集为一组时间序列数据,从 1790 年至 1970 年,每隔 10 年取一个值1.2 Titanic 数据集记录了泰坦尼克号沉船事件中乘客年龄,性别,船舱等级,以及是否存活 4 项信息。...
  • 如何使用R语言中的内置数据集

    万次阅读 2018-10-29 07:51:45
    如何使用R语言中的内置数据集 最近在学习PSM分析方法时,找了许久也找不到相应的案例数据, 就想到了使用R语言中内置的数据集来进行学习。R语言内置数据集有两个优点: 一是,数据源真实可靠,多数是研究者贡献的...
  • 关于关联规则里面那个数据集Groceries,我想把他转换成稀疏矩阵,就好像Session IDList of media categories accessed1{News, Finance}2{News, Finance}3{Sports, Finance, News}4{Arts}5{Sports, News, Finance}6{...
  • mtcars数据集包含32种汽车模型的数据, 这些数据取自《美国汽车》杂志(1974年《汽车趋势》杂志)。对于每辆汽车, 有11个要素, , 它们是:“mpg” “cyl” “disp” “hp” “drat” “wt” “qsec” “vs” “am” ...
  • R语言——查看内置数据集

    万次阅读 2020-04-15 13:45:04
    R语言自带了一些数据集,安装的包中也会包含一些数据集,这些数据集的查看方法如下: 1.>data() #列出已载入的包中的所有数据集。 > data() Data sets in package ‘boot’: acme Monthly Excess Returns...
  • 刚开始学习R语言,要完成一个数据挖掘的项目,想问问大家R语言怎么导入iris数据集呀?
  • 使用预加载在生存包中的Lung数据集,该数据集包含来自 North Central 癌症治疗组的 228 名晚期肺癌患者的数据,基于 10 个特征。数据集包含缺失值,因此假设在构建模型之前在您身边完成缺失值处理。 # Installing ...
  • 数据可视化】基础数据画图_鸢尾花数据 iris.csv
  • R笔记|R包下载命令及自带数据集

    千次阅读 2021-07-15 09:05:27
    R包 【安装包】 #指令下载R安装包 install.packages("packge-name") #通过以下步骤安装 点击右下方页面窗口中的“packages”--“install”进行安装,输入所要安装的R包名,默认从官网上下载 #对于版本不合适的使用...
  • 当有新方法时,找不到相应的数据时,可到R语言中package中自带的数据集中找一找。那么,怎么看某个特定的package中包含哪些数据集呢?可采用如下命令:print(data(package='具体的package名'))例如:print(data...
  • print(data(package="maxstat")) Error in .rs.pager(files, header, title, delete.file) : File C:\Users\刘\AppData\Local\Temp\RtmpUx9nmn\RpackageIQR406c460ebc2 does not exist.

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 24,599
精华内容 9,839
关键字:

r语言自带数据集