Azure ML - обучаем модель по сегментам набора данных - PullRequest
1 голос
/ 29 мая 2019

Я мог бы действительно помочь!

Компания, в которой я работаю, состоит из 52 очень разных предприятий, поэтому я не могу прогнозировать на уровне компании, но вместо этого мне нужно прогнозировать бизнес по бизнесу, а затем сворачивать результат, чтобы дать общий прогноз компании.

Я написал модель ML в studio.azureml.net Он отлично работает с коэффициентом определения 0,947, но это для одного из предприятий. Теперь мне нужно тренировать модель для других 51.

Есть ли способ сделать это в одной модели ML вместо создания 52 очень похожих моделей?

Любая помощь будет принята с благодарностью !!!

С уважением Martin

1 Ответ

0 голосов
/ 07 июня 2019

Вы можете использовать ансамбли, комбинируя несколько моделей для улучшения прогнозов. Наиболее прямым является стекирование, когда выходные данные всех моделей обучаются по всему набору данных. Метод, который, я думаю, лучше всего соответствует вашей проблеме, - это пакетирование (начальная загрузка). Необходимо разделить обучающий набор на разные подмножества (каждое из которых соответствует определенному бизнесу), затем обучить разные модели для каждого подмножества и объединить результаты каждого классификатора. Другим способом является повышение, но его сложно реализовать в Azure ML. Вы можете увидеть пример в Azure ML Gallery .

Цитата из книги:

Укладку и упаковку можно легко внедрить в Azure Machine Обучение, но другие методы ансамбля являются более сложными. Кроме того, это оказывается очень утомительным для внедрения в машинное обучение Azure Ансамбль, скажем, более пяти моделей. Эксперимент наполнен модули и довольно сложно поддерживать. Иногда стоит использовать любой метод ансамбля, доступный в R или Python. Добавление больше модели ансамбля, написанные в сценарии, могут быть такими же тривиальными, как изменение числа в коде вместо копирования и вставки модулей в эксперимент.

Для получения дополнительной информации вы также можете посмотреть документацию sklearn (Python) и символ каретки (R).

...