Кодирование меток в Azure Studio. - PullRequest
2 голосов
/ 10 мая 2019

Я пытаюсь найти эквивалент sklearn LabelEncoder или OrdinalEncoder в Azure ML Studio.Я понимаю, что модуль «Преобразовать в значения индикатора» выполняет однократное кодирование, но не могу найти ничего, что могло бы выполнять кодирование меток.

У меня есть столбец с шестью уникальными строковыми значениями, и мне нужно представить эти данные с целыми числами от 0 до 6.

Сейчас я использую скрипт Python Execute.модуль для этого, но мне было интересно, есть ли встроенный модуль для этого.

1 Ответ

1 голос
/ 10 мая 2019

Существует Модуль хеширования , который преобразует строки в целочисленные объекты с использованием библиотеки Vowpal Wabbit. Он создает словарь и на основе этого словаря преобразует свои элементы в значения хеш-функции. Поэтому вместо строкового столбца у вас будут данные в следующем формате:

Hashing feature 1   Hashing feature 2   Hashing feature 3
1                   0                   0
...