Использование sklearn One Hot Encoding категорий с диапазоном значений - PullRequest
0 голосов
/ 12 марта 2020

Я пытался воспроизвести пример для MLP, используя Python.

. Дата, используемая для обучения, включает месяц, день недели, часы и минуты.

Они преобразуются в один вектор с предварительной обработкой склеарна Однако в примере используется атрибут n_values ​​для установки диапазона каждого значения, как показано в приведенном ниже коде:

  training_set = np.array([
  [9, 5, 21, 13],
  [9, 6, 22, 59],
  [10, 1, 1, 7],
  [6, 3, 13, 20],
  [2, 4, 16, 25],
])


test_set = np.array([
  [9, 5, 22, 54],
  [9, 6, 6, 15],
  [2, 4, 15, 23],
  [10, 1, 2, 19],
  [5, 3, 12, 4],
])

batch_size = training_set.shape[0]

# Convert training & test sets to one-hot vectors

encoder = preprocessing.OneHotEncoder(
  n_values=[12, 7, 24, 60],
  sparse=False
)

encoder.fit(training_set)
x_train = encoder.transform(training_set)
x_test = encoder.transform(test_set)

Теперь, когда n_values ​​устарела и заменена категориями, как я могу использовать кодировщик с данными обучения видел выше? Спасибо всем.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...