Обязательно ли преобразовывать категориальные данные в числовые данные для использования интерпретации (пакет Microsoft)? - PullRequest
0 голосов
/ 11 марта 2020

Я новичок в пакете InterpretML Python с открытым исходным кодом и хочу знать, необходимо ли преобразовывать категориальные данные в числовые, чтобы использовать любой стеклянный / черный ящик, спасибо!

1 Ответ

1 голос
/ 13 марта 2020

Для обучения EBM (Объяснимые бустинговые машины), которые являются моделями из стеклобокса, вам не нужно преобразовывать категориальные данные в цифры c. EBM может принимать Pandas фреймы данных, содержащие смесь типов (цифры c и строки, представляющие категории), и неявно обрабатывать преобразования.

Для других методов в InterpretML, включая методы черного ящика, вам нужно будет самостоятельно обрабатывать преобразования в это время (с помощью такой техники, как One Hot Encoding ).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...