精华内容
下载资源
问答
  • dplyr

    2019-07-15 14:32:00
    dplyr包可用于处理 R 内部或者外部的结构化数据,相较于plyr包,dplyr包专注接受 data.frame 对象,大幅提高了速度,并且提供了更稳健的数据库接口。同时,dplyr包可用于操作Spark的dataframe。 官...

    The d is for dataframes, the plyr is to evoke pliers. Pronounce however you like.

    dplyr包可用于处理 R 内部或者外部的结构化数据,相较于plyr包,dplyr包专注接受 data.frame 对象,大幅提高了速度,并且提供了更稳健的数据库接口。同时,dplyr包可用于操作Spark的dataframe。

    官网:https://cran.r-project.org/web/packages/dplyr/index.html

    包中的函数查询:https://cran.r-project.org/web/packages/dplyr/dplyr.pdf

    安装dplyr包

    install.packages("dplyr")

    使用dplyr包

    library("dplyr")

    dplyr包中的重要函数

    -- 根据值选择相应的行   filter()

    -- 对行重新排序  arrange()

    -- 根据列名选择相应的列  select()

    -- 根据已知的列创建新的列  mutate()

    -- 将许多值塌缩为单个描述性汇总  summarize()

    -- 分组 group_by()   这些函数都可以通过 group_by() 衔接起来,该函数改变上述每个函数的作用域,从操作整个数据集到按组与组进行操作。

    使用 nycflights13包中的数据集

    install.packages("nycflights13")

    library("nycflights13")

    使用 filter() 函数过滤

    filter(flights, month == 1, day == 1)    # 过滤数据

    filter(flights, month == 11 | month == 12)   # 逻辑或

    filter(flights, month %in% c(11, 12))  # %in% 判断是否存在;该语句可以替换上面的语句

     

    使用 arrange() 函数对行重新排序

    arrange(flights, desc(arr_delay))    # 按照列 arr_delay 进行降序排列

    使用 select() 函数选择指定列

    select(flights, year, month, day)    # 选择列 year  month  day

    select(flights, year:day)     # 选择 year 和 day 之间的所有列

    select(flights, -(year:day))    # 反向选择 选择 year 和 day 之间的所有列以外的所有列

    select(flights, starts_with("yea"))    # 选择列名以 "yea" 开头的列

    select(flights, ends_with("ear"))    # 选择列名以 "ear" 结尾的列

    select(flights, contains("ea"))    # 选择列名中包含 "ea" 的列

    select(flights, matches("ea"))    # 使用正则表达式  选择列名中匹配到 "ea" 的列

    select(flights, num_range("x", 1:3))    # 使用正则表达式  选择列名中匹配到 "x1" "x2" "x3" 的列

    select(flights, time_hour, air_time, everything())    # 将 time_hour列 和 air_time列 提到前面

    查看 select() 函数的更多内容 ?select()

    rename(flights, tail_num = tailnum)     # 将列名 tailnum 改为 tail_num

    mutate(flights_sml, gain = arr_delay - dep_delay, speed = distance / air_time * 60 )     #  在原数据集flights_sml的基础上添加两列 gain, speed 产生一个新的数据集,原数据集不变。

    transmute(flights, gain = arr_delay - dep_delay, hours = air_time / 60, gain_per_hour = gain / hours)    # 只生成新的3列 gain, hours, gain_per_hour,输出结果中没有元数据集

    transmute(flights, dep_time, hour = dep_time %/% 100, minute = dep_time %% 100)    #  %/% 整除运算;  %% 取余运算

    使用 summarise() 函数对数据进行描述性汇总 结果只输出指定的类 

    常与 group_by() 一起使用 从而实现将数据分组后再统计

    summarize(flights, delay = mean(dep_delay, na.rm = TRUE))      #

    by_day <- group_by(flights, year, month, day)

    summarize(by_day, delay = mean(dep_delay, na.rm = TRUE))

    not_cancelled <- flights %>% filter(!is.na(dep_delay), !is.na(arr_delay))     # 使用管道操作

    not_cancelled %>% group_by(year, month, day) %>% summarize(mean = mean(dep_delay))    # 使用管道操作

     delays %>% filter(n > 25) %>% ggplot(mapping = aes(x = n, y = delay)) + geom_point(alpha = 1/10)

    batting <- as_tibble(Lahman::Batting)

    batting %>% group_by(playerID) %>% summarize(ba = sum(H, na.rm = TRUE) / sum(AB, na.rm = TRUE), ab = sum(AB, na.rm = TRUE)) %>% filter(ab > 100) %>% ggplot(mapping = aes(x = ab, y = ba)) + geom_point() + geom_smooth(se = FALSE)     # 分组 > 汇总 > 过滤 > 绘图

    not_cancelled %>% group_by(dest) %>% summarize(carriers = n_distinct(carrier)) %>% arrange(desc(carriers))    # 分组 > 汇总 > 降序排列

    not_cancelled %>% group_by(year, month, day) %>% summarize(avg_delay1 = mean(arr_delay), avg_delay2 = mean(arr_delay[arr_delay > 0]))    #  分组 > 汇总

    not_cancelled %>% group_by(dest) %>% summarize(distance_sd = sd(distance)) %>% arrange(desc(distance_sd))    # 分组 > 汇总 > 降序排列

    not_cancelled %>% group_by(year, month, day) %>% summarize( first = min(dep_time), last = max(dep_time))    #  分组 > 汇总(取每一组的最大值和最小值)

     

    转载于:https://www.cnblogs.com/0820LL/p/11188746.html

    展开全文
  • dplyrdplyr:数据处理的语法
  • dplyr interactions

    2020-12-27 03:05:31
    vroom_str(dplyr::filter(x, cyl == 4)) #> 'tbl_df', 'tbl', and 'data.frame': 11 obs., 3 vars.: #> $model: altrep:false type: character length:11 #> $mpg: altrep...
  • dplyr

    2021-03-23 19:32:00
    R语言中的有一个数据处理的强大的包,它就是 dplyr 包,dplyr包 像操作数据库一样操作 R,方便,轻松,快捷。 主要内容 1、选择数据表的列: select, rename2、select 只会选择你指定的列3、rename 则会改变列名, ...
     

    R语言中的有一个数据处理的强大的包,它就是 dplyr 包,dplyr包 像操作数据库一样操作 R,方便,轻松,快捷。

    主要内容

    • 1、选择数据表的列: select, rename
    • 2、select 只会选择你指定的列
    • 3、rename 则会改变列名, 并选择其他所有的列
    • 4、选择数据表的行: filter
    • 5、改变数据表的列: mutate, transmute
    • 6、mutate 会保留改变前和改变后的列
    • 7、transmute 则只会保留改变后的列, 而扔掉改变前的列
    • 8、通过 group_by 和 summarize 函数可以把数据进行分组进行分析

    选取数据
    在 SQL 数据库中, 我们做任何的操作首先需要选择数据, 在 R 中同样也是.

    例如我们还拿 iris 的数据来做例子. iris 数据长下面这样:

    head(iris) 
    #   Sepal.Length Sepal.Width Petal.Length Petal.Width Species 
    # 1          5.1         3.5          1.4         0.2  setosa 
    # 2          4.9         3.0          1.4         0.2  setosa 
    # 3          4.7         3.2          1.3         0.2  setosa 

    如果我们想要选择 Species 列的数据. 在 R 中可以用 data.frame 的选择数据的方法.

    iris$Species
    

    iris[[‘Species’]]

    iris[, ‘Species’]

    那么假如 iris 是 SQL 数据库中的一个表呢? 我们大概有以下的办法:

    SELECT Species FROM iris;

    dplyr 中提供了 select 函数具有和 SQL 语法逻辑类似的函数 select.

    select(iris, Species)

    还可以使用很有特色的 %>% 导管运算符.

    iris %>% select(Species)

    我们可以知道 Species 列中所包含的物种种加词有如下几个:

    table(iris %>% select(Species)) 
    #     setosa versicolor  virginica 
    #         50         50         50

    下面我们想要只选择 setosa 物种的数据.
    使用 R 默认方法我们会如下做.

    setosa <- iris[iris$Species == 'setosa', ]

    如果使用 SQL 去选择, 我们可能会写下如下类似的代码.

    SELECT * FROM iris WHERE Species = 'setosa';

    利用 dplyr 的 select 函数我们会有如下的代码.

    iris %>% select(everything()) %>% filter(Species == 'setosa') 
    #   Sepal.Length Sepal.Width Petal.Length Petal.Width Species 
    # 1          5.1         3.5          1.4         0.2  setosa 
    # 2          4.9         3.0          1.4         0.2  setosa 
    # 3          4.7         3.2          1.3         0.2  setosa

    这里 select 实际上没有起到任何作用, 但是显示出来如果我们要进行多步骤的操作, %>% 运算符会让代码很清晰简介.
    如果我们没有使用 %>% 则会有下面的代码.

    filter(select(iris, everything()), Species == 'setosa')

    这样看起来代码就多了好多层, 不如一层清晰.

    那么, 我们且用起来 select 函数, 假如我们只需要 setosa 花瓣的信息, 我们可以这么做.

    iris %>% select(Species, starts_with('Petal')) \
         %>% filter(Species == 'setosa') 
    #   Species Petal.Length Petal.Width 
    # 1  setosa          1.4         0.2 
    # 2  setosa          1.4         0.2 
    # 3  setosa          1.3         0.2

    又如果, 我们先要看 setosa 所有特征的宽度, 我们可以这么做.

    iris %>% select(Species, ends_with('Width')) \
         %>% filter(Species == 'setosa') 
    #   Species Sepal.Width Petal.Width 
    # 1  setosa         3.5         0.2 
    # 2  setosa         3.0         0.2 
    # 3  setosa         3.2         0.2

    我们也可以使用 select 对列进行重命名, 相当于 SQL 的 AS.
    SQL 中代码类似如下:

    SELECT Species AS sp.name FROM iris;

    select 函数的代码可以如下写.

    iris %>% select(sp.name = Species) 
    #   sp.name 
    # 1  setosa 
    # 2  setosa 
    # 3  setosa

    这里需要注意的是, 我们使用 select 函数则在结果中只会保留选择的列.
    如果我们只是需要对特定列进行重命名, 而需要保留原来其他的列, 则可以使用 rename 函数.

    iris %>% rename(sp.name = Species) 
    #   Sepal.Length Sepal.Width Petal.Length Petal.Width sp.name 
    # 1          5.1         3.5          1.4         0.2  setosa 
    # 2          4.9         3.0          1.4         0.2  setosa 
    # 3          4.7         3.2          1.3         0.2  setosa

    上面我们看到了 everything 等函数, 还有如下函数在 select 函数中使用.

    • starts_with(match, ignore.case = TRUE, vars = current_vars()):
      列名以前缀开始;
    • ends_with(match, ignore.case = TRUE, vars = current_vars()): 列名以后缀结束;
    • contains(match, ignore.case = TRUE, vars = current_vars()):
      列名中包含指定字符串;
    • matches(match, ignore.case = TRUE, vars = current_vars()): 列名匹配正则表达式;
    • num_range(prefix, range, width = NULL, vars = current_vars()): prefix
      接受一个前缀, range 接受数字序列;
    • one_of(…, vars = current_vars()): 列名包含在其中;
    • everything(vars = current_vars()): 所有的列名.

    改变列值
    有的时候, 当前的列值并不满足我们的使用, 我们需要对当前列的值进行处理,例如求 log, 绝对值等, 也可能对多列同时进行处理获得对应的值来进行下游的分析. 这种情况下我们可以使用 dplyr 中的 mutate 函数和 transmutate 函数. 这两个函数的区别在于, mutate 函数会保留修改后的列和修改之前的列, 而 transmute 函数则会保留修改后的列而丢弃修改之前的列.

    例如, 我们要求鸢尾花的萼片和花瓣的 “面积”, 可以假设是椭圆形.

    iris %>% mutate(
        Sepal.area = pi * Sepal.Length * Sepal.Width
    ) %>% select(Species, starts_with('Sepal')) 
    #   Species Sepal.Length Sepal.Width Sepal.area 
    # 1  setosa          5.1         3.5   56.07743 
    # 2  setosa          4.9         3.0   46.18141 
    # 3  setosa          4.7         3.2   47.24955
    

    iris %>% transmute(
    Sepal.area = pi * Sepal.Length * Sepal.Width
    )
    # Sepal.area
    # 56.07743
    # 46.18141
    # 47.24955

    可以用于 mutate 和 transmute 函数还有许多辅助函数, 有些是 base 包中的常规函数, 有些是 dplyr 包中的提供的函数.

    log(), log2(), log10(): 对值求 log;
    lead(), lag(): 返回序列中当前位置前第几个值或后第几个值;
    row_number(): 结果等于 rank(ties.method = "first"), 即对于相同的数值的排名按照先后顺序排;
    min_rank(): 结果等于 `rank(ties.method = "min"), 即对于相同的数值的排名都取最小的排名;
    dense_rank(): 结果类似于 min_rank(), 差别在于填充了由于 min_rank 造成的排名空隙;
    percent_rank(): 把 min_rank() 的值转换为 01 区间;
    cume_dist(): 计算比当前值还小的值的比例, 相当于计算 density;
    ntile(): 把数据分成若干块, 看每个数据在具体拿一个块;
    cumsum(), cummean(), cummin(), cummax(), cumany(), cumall(): 累积地 (cumulative) 计算和 (sum), 均值 (mean), 最小值 (min), 最大值 (max), 任何为真 (any), 所有为真 (all);
    na_if(): 把特定地值转换为 NA;
    coalesce(): 找出若干列中第一个不为 NA 的值;
    if_else(): 向量化的 ifelse 函数的效果.
    recode: 把一系列值转换为其他值
    case_when: 多条件选择.
    theseq <- c(5, 1, 3, 2, 2, NA)
    

    lead(theseq, 1)
    # 最后一位缺少的补 NA
    # [1] 1 3 2 2 NA NA

    lag(theseq, 1) # 第一位缺少的补 NA
    # [1] NA 5 1 3 2 2

    row_number(theseq)
    # [1] 5 1 4 2 3 NA

    min_rank(theseq)
    # [1] 5 1 4 2 2 NA

    dense_rank(theseq)
    # [1] 4 1 3 2 2 NA

    cume_dist(theseq)
    # [1] 1.0 0.2 0.8 0.6 0.6 NA

    ntile(theseq, 3)
    # [1] 3 1 2 1 2 NA

    cumsum(theseq)
    # [1] 5 6 9 11 13 NA

    na_if(theseq, 2)
    # [1] 5 1 3 NA NA NA

    coalesce(theseq, c(NA, 1, 2, NA, 4, 5))
    # [1] 5 1 3 2 2 5

    recode(theseq, ‘2’ =‘two’, ‘5’=‘five’)
    # [1] “five” NA NA “two” “two” NA

    case_when(
    theseq %% 2 == 0 ~ ‘even’,
    theseq %% 2 == 1 ~ ‘odd’ )
    # [1] “odd” “odd” “odd” “even” “even” NA

    分割-应用-整合

    拿我们的 iris 数据来说, 如果我想要知道每个物种的每一种属性的均值, 就可以使用 group_by 和 summarize 函数来获得.

    iris %>% group_by(Species) \
         %>% summarize(
             Sepal.Width=mean(Sepal.Width),
             Sepal.Length=mean(Sepal.Length),
             Petal.Length=mean(Petal.Length),
             Petal.Width=mean(Petal.Width) ) 
    #      Species Sepal.Width Sepal.Length Petal.Length Petal.Width 
    #       <fctr>       <dbl>        <dbl>        <dbl>       <dbl> 
    # 1     setosa       3.428        5.006        1.462       0.246 
    # 2 versicolor       2.770        5.936        4.260       1.326 
    # 3  virginica       2.974        6.588        5.552       2.026

    同样, 也有众多的函数可以用于 summarize 函数.

    mean(), median(), max(), min(), sd(),
    IQR(), mad() 等统计函数.
    first(), last(), nth(): 返回第几位的值.
    n(): 计算数据的数量, 相当于 length() 函数.
    n_distinct(): 计算非重复数据的数量, 相当于 length(unique(x)).
    any(), all(): 逻辑计算函数.

    排序
    在分析的时候需要对数据进行排序, dplyr 提供了 arrange 函数. 例如我们按照 Petal.Width 对数据进行从小到大排序.

    iris %>% arrange(Petal.Width) 
    #   Sepal.Length Sepal.Width Petal.Length Petal.Width Species 
    # 1          4.9         3.1          1.5         0.1  setosa 
    # 2          4.8         3.0          1.4         0.1  setosa 
    # 3          4.3         3.0          1.1         0.1  setosa

    配合 desc 函数可以实现从大到小排序.

    iris %>% arrange(desc(Petal.Length), Petal.Width)
     #   Sepal.Length Sepal.Width Petal.Length Petal.Width   Species 
    # 1          7.7         2.6          6.9         2.3 virginica 
    # 2          7.7         2.8          6.7         2.0 virginica 
    # 3          7.7         3.8          6.7         2.2 virginica
    展开全文
  • V1 dplyr fix

    2020-12-27 12:22:54
    <div><p>This should fix dplyr filter() that is changed by the version 0.8.0 release of dplyr which is scheduled for February 1, 2019. See ...
  • 分布式dplyr

    2018-08-31 00:17:24
    分布式dplyr提供了对R中的dataframe和分布式dataframe提供了一致的操作接口    

    分布式dplyr提供了对R中的dataframe和分布式dataframe提供了一致的操作接口

     

     

    展开全文
  • 右旋吡咯 使用提供的数据集在R(dplyr包)中进行练习的RMD文件。
  • <p><code>src_dt</code> assignment at line 181 of rpy/robjects/lib/dplyr.py is no longer viable as of dplyr 0.5, as Hadley has moved this out to the new "dtplyr" package. With this additional ...
  • expanding dplyr episode

    2020-12-09 06:24:12
    It is already a good overview of dplyr's basis functions but I feel like <strong>introducing the concept of joins</strong> would be highly beneficial to the learners. This would give opportunities...
  • R语言dplyr包的数据整理、分析函数用法文章连载NO.01 在日常数据处理过程中难免会遇到些难处理的,选取更适合的函数分割、筛选、合并等实在是大快人心! 利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续...

    R语言dplyr包的数据整理、分析函数用法文章连载NO.01

    在日常数据处理过程中难免会遇到些难处理的,选取更适合的函数分割、筛选、合并等实在是大快人心!

    利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续数据建模创造环境;本篇涉及到的函数为filter、filter_all()、filter_if()、filter_at()、mutate、group_by、select、summarise。

    1、数据筛选函数:

    #可使用filter()函数筛选/查找特定条件的行或者样本
    #filter(.data=,condition_1,condition_2)#将返回相匹配的数据

    #同时可以多条件匹配multiple condition,当采用多条件匹配时可直接condition1,condition2或者condition1&condition2
    #其他逻辑表达还有:==,>,>=等,&,|,!,xor(),is.na,between,near

    #filter延展的相关函数filter_all()、filter_if()、filter_at()

    #以iris数据集为例:

    filter(.data=iris,Sepal.Length>3,Sepal.Width<3.5)
    
    filter(.data=iris,Sepal.Length>3,Species=="virginica")
    

    输出情况:                                                                          输出情况: 

    #要使用filter_all()、filter_if()、filter_at()需要先去掉Species列(非数值型列) 

    iris_data<-iris%>% select(-Species)
    

    #筛选所有属性小于6的行 

    iris_data%>% filter_all(all_vars(.<6))

    部分输出情况: 

     
    #筛选任意一个属性大于3的行

    iris_data%>% filter_all(any_vars(.>3))

    #筛选以sep开头的属性任一大于3的行

    iris_data%>% filter_at(vars(starts_with("Sep")), any_vars(. >3))

    #R中自带数据集mtcars,筛选任意一个属性大于150的行

    filter_all(mtcars, any_vars(. > 150))

    #筛选以d开头的属性任一可被2整除的行

    filter_at(mtcars, vars(starts_with("d")), any_vars((. %% 2) == 0))

    2、数据分组、汇总函数group_by、summarise

    其他延展函数 group_by_all、group_by_if、group_by_at(将在后续文章中解析)

     group_by函数按照某个变量分组,对于数据集本身并不会发生什么变化,只有在与mutate(), arrange() 和 summarise() 函数结合应用的时候会体现出它的优越性,将会对这些 tbl 类数据执行分组操作 (R语言泛型函数的优越性).

    mtcars_cyl <- mtcars %>% group_by(cyl)
    
    mtcars_cyl %>% summarise(
    disp = mean(disp),
    hp = mean(hp)
    )

    mtcars_vs_am <- mtcars %>% group_by(vs, am)
    
    mtcars_vs <- mtcars_vs_am %>% summarise(n = n())

    3、新增列函数mutate,在数据集的基础上新增列,不对原数据作更改

    可用的相关参数、逻辑:

    • +, - 等等
    • log()
    • lead(), lag()
    • dense_rank(), min_rank(), percent_rank(), row_number(), cume_dist(), ntile()
    • cumsum(), cummean(), cummin(), cummax(), cumany(), cumall()
    • na_if(), coalesce()
    • if_else(), recode(), case_when()

    相关延展函数:transmute、mutate_all、mutate_if、mutate_at(后期文章分享)

    mtcars %>% as_tibble() %>% mutate(
    cyl2 = cyl*3,
    cyl4 = cyl2+2
    )

     

    奉节脐橙性凉,味甘酸,归肺、脾、胃经;具有生津开胃、止呕、清肠、保护血管的功效。

    奉节脐橙中富含维C和维P以及胡萝卜素,可以抑制致癌物质的形成,还能软化和保护血管,促进血液循环,降低胆固醇和血脂;维生素P可以有效防止维C被破坏。盐蒸橙子是化痰止咳良药。橙皮里有两种成分具有止咳化痰的功效,一个是那可汀,一个是橙皮油。这两种成分,只有在蒸煮之后才会从橙皮中出来,所以咳嗽有痰的时候,不妨蒸个橙子试试

    https://weidian.com/?userid=1267683370

     

     

    数据预处理、分类汇总、变量名批量修改、异常判断、多变量循环等

    下一篇预告    arrange、order_by、compute、sample、n_distinct等,后面还会讲Hmisc这个包,很不错。

    展开全文
  • dplyr

    2017-03-22 18:59:00
    是Hadley Wickham的新作,...tidyr包的作者是Hadley Wickham, 该包用于“tidy”你的数据,这个包常跟dplyr结合使用。 本文将介绍dplyr包的下述五个函数用法:筛选: filter()排列: arrange()选择: select()变形: ...
  • <p>With <code>dplyr</code> we will do these as follows <pre><code> r library(dplyr) grp_df </code></pre> <p>Now with <code>data.table</code> this is somewhat more complicated <pre><code> r library...
  • dplyr包概述

    2017-03-31 14:15:33
    dplyr
  • <p>When I installed it anyway and the loaded <code>skimr, loading <code>dplyr</code> second failed with <pre><code>Package ‘dplyr’ version 0.8.0.1 cannot be unloaded: Error in unloadNamespace...
  • Impala的SQL后端dplyr-源码
  • New dplyr Cheat Sheet

    2020-12-26 19:52:24
    <p>Dplyr is a library in R to perform various data manipulation tasks with data frame like objects <p>Instant Answer Page: https://duck.co/ia/view/dplyr_cheat_sheet</p> 该提问来源于开源项目:...
  • R dplyr,sparklyr,strings 文档
  • 大数据:使用dplyr分析大数据
  • 熟悉R的朋友都会知道,dplyr包是对原始的数据集进行清洗、整理以及变换的有力武器之一。但是其使用会局限于你需要有打开R/R studio或者通过R脚本来执行dplyr。对于这个问题,今天即将需要介绍的dplyr-cli就能很好的...
  • r语言函数dplyr 按列分析数据是R的一大优势。 但是,如果您是Tidyverse用户,并且想要跨多个列运行一个函数,该怎么办? 从dplyr 1.0开始,将为此提供一个新功能:cross across(). 让我们来看看。 当本文发表...
  • dtplyr:dplyr的数据表后端
  • Translate plyr to dplyr?

    2020-12-28 03:31:20
    <div><p>Here is a good example where I could update from plyr code to dplyr (from 4.7 Drawing maps): <pre><code> s library(plyr) library(ggplot2) ia </code></pre> <p>to <pre><code> s library(dplyr) ...
  • dplyr包30个实例

    2021-04-01 00:34:10
    dplyr包30个实例 dplyr软件包是R中功能最强大,最受欢迎的软件包之一。该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等。本文包括一些示例和如何使用使用dplyr...
  • Tidyr+dplyr+ggplot2

    2017-12-21 15:45:32
    R reference card for tidyr dplyr ggplot2,which can be simply used in usual.
  • dplyr实例使用案例,主要用于清洗数据,整理数据使用。是不可多得的改进包
  • t know if this is a <code>dplyr</code> issue or an <code>RMySQL</code> issue, but I get an error when I try to connect a <code>dplyr</code> <code>tbl</code> to an <code>RMySQL</code> table. ...
  • Run `dplyr` package examples

    2020-12-29 23:52:06
    <div><p>Make sure FastR can install <code>dplyr</code> and run <code>dplyr</code> examples. <p>Some issues: <code>dplyr</code> uses <code>Rcpp, which under some circumstances (e.g. in function <code>...
  • dplyr包笔记

    2018-03-17 16:51:00
    dplyr包是R语言数据处理的神器,这里记录一点刚学到的东西。 以下操作基于R语言自带数据集"mtcars". 变量选取: select starts_with(): starts with a prefix ends_with(): ends with a prefix contains(): conta...
  • dplyr包的用法

    2021-03-07 16:38:42
    面德勤的时候被要求用R的dplyr包处理数据(题做的不是很好所以被拒了orz),了解了一下发现和SQL的基础操作还蛮像,????上来供以后参考。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,176
精华内容 870
关键字:

dplyr