в SageMaker у вас есть 3 варианта написания научного кода:
- Встроенные алгоритмы
- Предварительно написанные контейнеры с открытым исходным кодом (доступно для sklearn, tenorflow, pytorch, mxnet, chainer. Keras можно записать в контейнеры tenorflow и mxnet)
- Принесите свой собственный контейнер (например, для R)
На момент написания этого поста во встроенной библиотеке не было ни случайного классификатора леса, ни регрессора .Во встроенной библиотеке есть алгоритм под названием Random Cut Forest , но это неконтролируемый алгоритм обнаружения аномалий, отличный от случая использования случайный лес scikit-learn , используемый вконтролируемый способ (также ответил в StackOverflow здесь ).Но легко использовать заранее написанный контейнер с открытым исходным кодом scikit-learn для реализации своего собственного.Вы можете использовать эту публичную демонстрацию sklearn-on-sagemaker и изменить модель.Преимущество предварительно написанных контейнеров перед опцией «Принеси свой собственный» заключается в том, что докер-файл уже записан, и стек веб-обслуживания тоже.
Что касается вашего удивления, что Случайный Лес не представлен во встроенномalgos, библиотека и ее 18 algos уже охватывают богатый набор вариантов использования.Например, для контролируемого обучения структурированным данным (обычный вариант использования для случайного леса), если вы хотите придерживаться встроенных функций, в зависимости от ваших приоритетов (точность, задержка вывода, масштаб обучения, затраты ...) выможет использовать SageMaker XGBoost (XGBoost выиграл множество соревнований по сбору данных - каждая победившая команда в топ-10 KDDcup 2015 использовала XGBoost согласно статье XGBoost - и хорошо масштабируется) и линейного ученика, который очень быстрона вывод и может быть обучен в масштабе, в мини-партии по GPU. Машины факторизации (линейное + взаимодействие 2-й степени с весами, являющимися точечными продуктами в столбцах) и SageMaker kNN и другие варианты.Кроме того, все не застыло в камне, и список встроенных алгоритмов быстро улучшается.