Я хотел бы связать строки двух df по именам столбцов, если столбец не существует во 2-й df, сначала должны быть NA.К сожалению, dplyr::bind_rows
имеет проблему с дублированными именами столбцов.Не могли бы вы помочь мне решить эту проблему?
Что я сделал до сих пор?
Сначала некоторые воспроизводимые данные:
df1 <- data.frame(replicate(6,sample(0:1,10,rep=TRUE)))
df2 <- data.frame(replicate(3,sample(0:1,10,rep=TRUE)))
colnames(df1) <- c('A','A','A','B','C','E')
colnames(df2) <- c('A','B','C')
df1
A A A B C E
1 0 1 0 1 1 1
2 1 1 1 0 0 0
3 0 0 1 1 0 1
4 0 0 1 0 1 1
5 0 1 0 1 1 0
6 1 0 1 1 1 1
7 0 0 1 1 1 0
8 0 1 0 1 1 0
9 0 1 0 0 1 0
10 1 1 0 1 1 0
df2
A B C
1 1 1 0
2 0 1 1
3 1 1 0
4 1 0 0
5 0 0 1
6 0 0 1
7 0 1 1
8 0 0 0
9 0 0 1
10 0 1 1
Что я хотел бы получить?
A A A B C E
1 0 1 0 1 1 1
2 1 1 1 0 0 0
3 0 0 1 1 0 1
4 0 0 1 0 1 1
5 0 1 0 1 1 0
6 1 0 1 1 1 1
7 0 0 1 1 1 0
8 0 1 0 1 1 0
9 0 1 0 0 1 0
10 1 1 0 1 1 0
11 1 1 1 1 0 NA
12 0 0 0 1 1 NA
13 1 1 1 1 0 NA
14 1 1 1 0 0 NA
15 0 0 0 0 1 NA
16 0 0 0 0 1 NA
17 0 0 0 1 1 NA
18 0 0 0 0 0 NA
19 0 0 0 0 1 NA
20 0 0 0 1 1 NA
Я решил использовать bind_rows
из dplyr
, но:
result <- bind_rows(mutate_all(df1, as.character), mutate_all(df2, as.character))
Error: Columns `A`, `A` must have unique names
Call `rlang::last_error()` to see a backtrace
Заранее спасибо за помощь!