Question

Как обрабатывать частые изменения в наборе данных в Azure Machine Learning Studio. Мой набор данных может со временем меняться, мне нужно добавить больше строк в набор данных. Как мне обновить sh набор данных , который я сейчас использую для обучения модели, используя недавно обновленный набор данных . Мне нужно, чтобы эта работа выполнялась программно (c# или python), а не вручную в студии.

Anders Swanson · Answer 1 · 14 марта 2020

При регистрации набора данных AzureML данные не перемещаются, сохраняется только некоторая информация, например, где находятся данные и как их следует загружать. Цель состоит в том, чтобы сделать доступ к данным таким простым, как вызов dataset = Dataset.get(name="my dataset")

В приведенном ниже фрагменте кода ( полный пример ), если я зарегистрирую набор данных, я могу технически перезаписать weather/2018/11.csv с помощью новая версия после регистрации, и мое определение набора данных останется прежним, но новые данные будут доступны, если вы будете использовать в нем обучение после перезаписи.

# create a TabularDataset from 3 paths in datastore
datastore_paths = [(datastore, 'weather/2018/11.csv'),
                   (datastore, 'weather/2018/12.csv'),
                   (datastore, 'weather/2019/*.csv')]
weather_ds = Dataset.Tabular.from_delimited_files(path=datastore_paths)

Однако есть еще два рекомендуемых подхода (мой команда выполняет оба действия)

Изолируйте ваши данные и зарегистрируйте новую версию набора данных, чтобы вы всегда могли выполнить откат к предыдущей версии набора данных. Рекомендации по управлению версиями набора данных
Используйте путь данных с подстановочным знаком / глобусом для ссылки на папку, в которую регулярно загружаются новые данные. Таким образом, вы можете получить Dataset, который со временем увеличивается в размере без необходимости перерегистрации.

büşra çelik · Answer 2 · 12 марта 2020

Это работает для вас? { ссылка }

Вы можете управлять объектом набора данных

Как справиться с частыми изменениями в наборе данных в azure Студия машинного обучения?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как справиться с частыми изменениями в наборе данных в azure Студия машинного обучения?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы