left_join в для l oop с разными именами столбцов - PullRequest
2 голосов
/ 24 марта 2020

У меня есть data.frame с именем a, структура которого похожа на: -

a <- data.frame(X1=c("A", "B", "C", "A", "C", "D"),
                X2=c("B", "C", "D", "A", "B", "A"),
                X3=c("C", "D", "A", "B", "A", "B")
               )

И у меня есть еще один набор: -

b <- data.frame(Xn=c("A", "B", "C", "D"),
                Feature=c("some", "more", "what", "why"))

Я хочу добавьте все Features из набора b в набор a, чтобы X1, X2 и X3 имели соответствующий столбец функций в наборе a. Другими словами, столбцы в наборе a становятся: -

colnames(a) <- c("X1", "X2", "X3", "Features1", "Features2", "Features3")

Как я могу сделать это, используя left_join в a для l oop ??

Ответы [ 2 ]

1 голос
/ 24 марта 2020

Это можно сделать с помощью mutate_all до recode всех столбцов в a:

library(tidyverse)

a %>% 
  mutate_all(funs(feat=recode(., !!!set_names(as.character(b$Feature), b$Xn))))
  X1    X2    X3    X1_feat X2_feat X3_feat
1 A     B     C     some    more    what   
2 B     C     D     more    what    why    
3 C     D     A     what    why     some   
4 A     A     B     some    some    more   
5 C     B     A     what    more    some   
6 D     A     B     why     some    more

Вы можете добавить rename_at чтобы получить нужные имена:

a %>% 
  mutate_all(funs(f=recode(., !!!set_names(as.character(b$Feature), b$Xn)))) %>% 
  rename_at(vars(matches("f")), ~gsub(".([0-9]).*", "Feature\\1", .))
  X1 X2 X3 Feature1 Feature2 Feature3
1  A  B  C     some     more     what
2  B  C  D     more     what      why
3  C  D  A     what      why     some
4  A  A  B     some     some     more
5  C  B  A     what     more     some
6  D  A  B      why     some     more
1 голос
/ 24 марта 2020

В базе R мы можем unlist a dataframe и match его с b$Xn, чтобы получить соответствующее Feature значение. Мы можем cbind перевести этот кадр данных в исходный, чтобы получить окончательный ответ.

temp <- a
temp[] <- b$Feature[match(unlist(temp), b$Xn)]
names(temp) <- paste0('Feature', seq_along(temp))
cbind(a, temp)

#  X1 X2 X3 Feature1 Feature2 Feature3
#1  A  B  C     some     more     what
#2  B  C  D     more     what      why
#3  C  D  A     what      why     some
#4  A  A  B     some     some     more
#5  C  B  A     what     more     some
#6  D  A  B      why     some     more

В tidyverse мы можем получить данные в длинном формате, объединить данные и вернуть их в широкоформатный формат.

library(dplyr)
library(tidyr)

a %>%
  mutate(row = row_number()) %>%
  pivot_longer(cols = -row) %>%
  left_join(b, by = c('value' = 'Xn'))  %>%
  select(-value) %>%
  pivot_wider(names_from = name, values_from = Feature) %>%
  select(-row) %>%
  rename_all(~paste0('Feature', seq_along(.))) %>%
  bind_cols(a, .)
...