Как H2O AutoML обрабатывает факторные переменные? - PullRequest
0 голосов
/ 23 января 2019

В настоящее время я использую AutoML H2O для проекта по науке о данных. Однако нигде в документации, в Интернете или в коде я не могу найти, как AutoML обрабатывает факторные переменные - выполняет ли он одноразовое кодирование? Кодировка метки? Что-то более продвинутое? Учитывает ли количество уровней? Зависит ли это от алгоритма?

В настоящее время AutoML работает очень плохо (незначительно выше базовой линии), и я подозреваю, что это потому, что он неправильно обрабатывает категориальные значения, что составляет около 90% моих предикторов.

1 Ответ

0 голосов
/ 23 января 2019

AutoML автоматически запускает контролируемые модели обучения, доступные в H2O-3. Таким образом, то, как AutoML обрабатывает категориалы, зависит от категориальной обработки по умолчанию для данной модели, в которой он работает. Документация по обработке категориальных значений может быть найдена здесь , если вы заинтересованы в конкретном алгоритме, используйте ту же документацию, чтобы найти интересующий вас алгоритм и просмотреть подробную информацию о том, как он обрабатывает категориальные значения, или использовать Python или R Документация API для поиска значений по умолчанию.

...