В качестве входных данных для модели дерева я создал таблицу анализа в SQL. Теперь я хочу перенести его в R, потому что модель, в которой эта таблица используется в качестве входных данных, также выполняется в R. Один из шагов SQL, который я не могу преобразовать в R.
Таблица анализа имеет следующий вид:
df <- data.frame(
pseudonym = c("a", "a", "a", "b", "c", "c"),
var1 = c(1,1,0,1,1,0),
var2 = c(1,0,0,0,0,1),
var3 = c(0,0,0,0,0,1))
> df
pseudonym var1 var2 var3
1 a 1 1 0
2 a 1 0 0
3 a 0 0 0
4 b 1 0 0
5 c 1 0 0
6 c 0 1 1
На следующем шаге мне нужны отдельные строки для псевдонима с сохранением информации (1) из других столбцов var1, var2, var3 . (В SQL это создается через max(case when...then 1 else 0 end) as var1
)
Таким образом, результат df2 , созданный из df1 , должен быть
df2 <- data.frame(
pseudonym = c("a", "b", "c"),
var1 = c(1,1,1),
var2 = c(1,0,1),
var3 = c(0,0,1))
> df2
pseudonym var1 var2 var3
1 a 1 1 0
2 b 1 0 0
3 c 1 1 1
It было бы очень полезно, если у кого-то есть идея.