Microsoft.ML rel 0.8.0 MLContext с текстовым файлом с различными типами данных - PullRequest
0 голосов
/ 02 ноября 2018

Я пытаюсь использовать ML.Net с CSV-файлом. Файл содержит

  1. данные о ценах (десятичные)
  2. Enum's (различные типы, как string)
  3. Статистические данные (с плавающей точкой)

Я пытаюсь следовать примеру , предоставленному в MlNetCookBook , однако я не могу использовать

FeatureVector: r.DecimalField1.ConcatWith(r.DecimalField2, r.EnumType1,r.EnumType2,r.FloatField1,...)

, поскольку типы несовместимы, и я бы хотел "Dictionarizer" значения перечисления.

Кто-нибудь знает, как это должно быть настроено с новым API?

Спасибо

1 Ответ

0 голосов
/ 02 ноября 2018

Dictionarizer () / ToKey () полезны для работы со строковыми метками в задачах классификации. Вывод имеет тип «Ключ», который нельзя объединить с имеющимися у вас числовыми функциями.

Для категориальных (перечислимых) функций вы, вероятно, захотите использовать OneHotEncoding, как @ClojureМного упомянуто: r.RTH.OneHotEncoding(). Это выведет вектор чисел с плавающей точкой, который затем можно будет объединить с другими имеющимися у вас числовыми объектами.

Если вы все еще видите ошибку, сможете ли вы поделиться своим TextLoader и конвейером оценки?

...