Как управлять несколькими наборами данных - Машинное обучение Azure - PullRequest
0 голосов
/ 10 апреля 2019

Есть ли модуль, который принимает более одного набора данных для обработки? Например, «Разделить данные», «Редактировать метаданные» и «Выбрать столбцы в наборе данных» не принимают более одного набора данных в качестве входных данных.

Вот что я сделал: В моей модели есть несколько числовых и категориальных переменных. Я использовал модуль «Преобразовать в переменные индикатора» для создания фиктивных переменных для моих данных. Как включить переменные индикатора и числовые переменные в один набор данных, чтобы можно было разделить данные для моей модели?

На данный момент я занимаюсь обработкой данных в Python и перемещаю наборы данных в Azure MLS для моделирования. В идеале мне нужно работать над обработкой данных в Azure MLS.

Я ожидаю, что в Azure MLS

будет иметься один модуль, объединяющий как категориальные переменные в двоичном виде, так и числовые переменные.

1 Ответ

0 голосов
/ 15 апреля 2019

Да, есть несколько модулей, получающих несколько наборов данных - Добавить столбцы , Применить преобразование SQL , Выполнить скрипт Python , если назвать несколько.

Не знаю, зачем вам они нужны для значений индикатора - если вы говорите о разделении поезда / теста, то я просто разделю данные после вызова модуля «Преобразовать в значения индикатора».

...