Мои данные имеют форму
Event Id Var1 Var2 Var3
1 a x w y
2 a z y w
3 b x y q
, и мне нужно создать закодированные по размеру векторы для каждой строки в таблице, учитывая все значения, появляющиеся в Var1, Var2 и Var3.Это означает, что желаемый результат будет:
Event Id x y z w q
1 a 1 1 0 1 0
2 a 0 1 1 1 0
3 b 1 1 0 0 1
Это означает, что я сохраняю то же количество строк исходного набора данных, я добавляю для каждой строки только количество столбцов, равное всем уникальным коэффициентам среди Var 1, Var 2 и Var3.
Я перепробовал все подходы, которые мог придумать, но пока что ничего не работает ..
Есть идеи?