Как задать одно горячее кодирование для категориальных значений для меток в оценщике Классификация в Tensorflow - PullRequest
1 голос
/ 07 июля 2019

У меня есть набор данных, в котором у меня есть строковые значения в метках для классификации. Я загрузил набор данных в Tensorflow и определил столбцы объектов для различных объектов. Поскольку у меня также есть категориальные данные в метках, как же дать им горячую кодировку им, чтобы Estimator.LinearClassifier мог изучать данные и прогнозировать метку?

1 Ответ

0 голосов
/ 07 июля 2019

Вы можете использовать панд. Предполагая, что у вас уже есть некатегориальные функции в фрейме данных 'df'.

Использование может использовать это:

import pandas as pd
featurelist_categorical = ['Feature A',
           'Feature B']

for i,j in zip(featurelist_categorical, ['A','B']):
  df = pd.concat([df, pd.get_dummies(data[i],prefix=j)], axis=1)

Префикс функции не обязателен, но он поможет вам особенно в случае нескольких категориальных функций.

Также, если вы по какой-то причине не хотите разбивать свои функции на числа, вы можете использовать H2O.ai. С H2O вы можете напрямую подавать категориальные переменные в модели в виде текста.

...