приборка: создать ключ без rowwise ()? - PullRequest
3 голосов
/ 01 апреля 2019

Есть ли способ создать key без использования rowwise()?

Любой указатель высоко ценится.

df <- tibble(grp1=rev(LETTERS[1:5]),grp2=letters[11:15],grp3=LETTERS[1:5],
      value=rnorm(5,10,10))

df %>% rowwise %>% mutate(key=paste(sort(c(grp1, grp2)), collapse="")) %>% ungroup()
  grp1  grp2  grp3  value             key  
  <chr> <chr> <chr> <chr>             <chr>
1 E     k     A     -3.73984194875213 AE   
2 D     l     B     3.25846392371014  BD   
3 C     m     C     3.62405652088127  CC   
4 B     n     D     6.41520621902784  BD   
5 A     o     E     20.1892413026407  AE 

Обновление: tibble содержитнесколько символьных векторов, но key следует генерировать из столбцов grp1 и grp3.

Ответы [ 3 ]

3 голосов
/ 01 апреля 2019

с использованием purrr::pmap_chr:

library(tidyverse)
df %>% mutate(key=pmap_chr(.[c("grp1","grp3")],~paste(sort(c(...)), collapse="")))
# # A tibble: 5 x 5
#   grp1  grp2  grp3  value             key  
#   <chr> <chr> <chr> <chr>             <chr>
# 1 E     k     A     22.0150932758833  AE   
# 2 D     l     B     2.24725610156698  BD   
# 3 C     m     C     -6.2414882455089  CC   
# 4 B     n     D     22.5699168856552  BD   
# 5 A     o     E     -6.21443670571301 AE 

В базе R вы можете сделать:

transform(df, key=mapply(function(...) paste(sort(c(...)), collapse=""), grp1, grp3)
2 голосов
/ 01 апреля 2019

Вот векторизованная опция, использующая pmin/pmap. Возьмите min/max для каждого ряда столбцов 'grp1', 'grp3' с pmin/pmax и объедините вместе (str_c)

library(dplyr)
library(stringr)
df %>%
   mutate(key = str_c(pmin(grp1, grp3), pmax(grp1, grp3)))
# A tibble: 5 x 5
#  grp1  grp2  grp3   value key  
#  <chr> <chr> <chr>  <dbl> <chr>
#1 E     k     A      24.7  AE   
#2 D     l     B       5.66 BD   
#3 C     m     C      16.3  CC   
#4 B     n     D       5.88 BD   
#5 A     o     E      -9.22 AE   

данные

df <- tibble(grp1=rev(LETTERS[1:5]),grp2=letters[11:15],grp3=LETTERS[1:5],
          value=rnorm(5,10,10))

ПРИМЕЧАНИЕ: cbind преобразуется в matrix, и матрица может содержать только один класс. Преобразование в tibble с помощью as_tibble не меняет класс автоматически. Вместо этого используйте tibble/data.frame напрямую вместо cbind route

1 голос
/ 01 апреля 2019

Другой способ - использовать mutate, без rowwise, но с векторной версией вашей функции, например так:

library(dplyr)

# create a function and vectorise it
f = function(x, y) paste(sort(c(x, y)), collapse="")
f = Vectorize(f)

# use the function
df %>% mutate(key = f(grp1, grp3))

# # A tibble: 5 x 5
#   grp1  grp2  grp3  value             key  
#   <chr> <chr> <chr> <chr>             <chr>
# 1 E     k     A     -4.41213449814982 AE   
# 2 D     l     B     10.4314736952111  BD   
# 3 C     m     C     5.69345098226371  CC   
# 4 B     n     D     4.39266020802413  BD   
# 5 A     o     E     22.0623810028979  AE
...