Я использую xgboost в H2O для задачи двоичной классификации. Набор данных имеет несколько категорических особенностей, к которым модель применяет горячее кодирование во время обучения.
Теперь я хочу использовать SHAP (https://github.com/slundberg/shap) для локальной интерпретации прогнозов. Для этого было бы неплохо иметь фрейм данных с закодированными в одну строку столбцами и значениями. Однако мне кажется,не найти способа получить это из модели H2O.
Я мог бы, вероятно, вручную воссоздать кодирование в горячем режиме, но, возможно, кто-то знает более быстрое решение?