Получить горячо закодированный H2OFrame - PullRequest
1 голос
/ 10 октября 2019

Я использую xgboost в H2O для задачи двоичной классификации. Набор данных имеет несколько категорических особенностей, к которым модель применяет горячее кодирование во время обучения.

Теперь я хочу использовать SHAP (https://github.com/slundberg/shap) для локальной интерпретации прогнозов. Для этого было бы неплохо иметь фрейм данных с закодированными в одну строку столбцами и значениями. Однако мне кажется,не найти способа получить это из модели H2O.

Я мог бы, вероятно, вручную воссоздать кодирование в горячем режиме, но, возможно, кто-то знает более быстрое решение?

1 Ответ

1 голос
/ 16 октября 2019

У нас был билет , открытый , на некоторое время, но мы скоро снова посетим его из-за повышенного спроса на эту функцию. На данный момент вам придется преобразовать ваш H2OFrame в Pandas DataFrame, используя метод as_data_frame(), а затем применить одно из следующих решений .

...