Хеширующий кодер в спарк 1.6 для высоких кардинальных категориальных переменных - PullRequest
1 голос
/ 15 мая 2019

Люди У меня есть огромный набор данных, который содержит категориальную переменную высокой мощности, и поэтому я хотел бы использовать некоторые хеширующие кодеры для преобразования категориальной переменной.Я не могу найти кодировщик хэширования в 1.6.Я вижу, что 2.1 и выше, как правило, имеют некоторые методы хеширования.Любые идеи относительно того, как я могу сделать это в 1.6?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...