У меня есть много столбцов в моем фрейме данных sparklyr (около 70), некоторые из которых должны быть в горячем коде, прежде чем я построю модель xgboost с использованием функции xgboost_classifier sparklyr. Однако я не знаю, какую функцию one_hot использовать и почему?
Я знаю, как работает ft_string_indexer, и я использовал это в сочетании с функцией one_hot_encoder, но получаю столбец, который не имеет особого смысла.
Это возвращаемый столбец. Работает ли с этим xgboost_classifier?
1 <dbl [5]>
2 <dbl [5]>
3 <dbl [5]>
4 <dbl [5]>
5 <dbl [5]>
6 <dbl [5]>
7 <dbl [5]>