Разница во времени (обучение с подкреплением) по H2O - PullRequest
0 голосов
/ 19 февраля 2019

Мне интересно знать, способна ли h2o реализовать временную разницу (обучение с подкреплением)?

Я знаю, что TensorFlow имеет такую ​​возможность.

1 Ответ

0 голосов
/ 21 февраля 2019

Список доступных алгоритмов H2O можно найти здесь .Краткий ответ на ваш вопрос - нет.Подробная информация об алгоритме глубокого обучения, который доступен здесь , и я опубликую для вашего удобства:

Алгоритм глубокого обучения H2O-3 основан на многослойной искусственной нейронной сети с прямой связью, которая обучаетсясо стохастическим градиентным спуском с использованием обратного распространения.Сеть может содержать большое количество скрытых слоев, состоящих из нейронов с функциями активации tanh, выпрямителя и maxout.Расширенные функции, такие как адаптивная скорость обучения, отжиг скорости, обучение импульсу, отсев, регуляризация L1 или L2, контрольные точки и поиск по сетке, обеспечивают высокую точность прогнозирования.Каждый вычислительный узел обучает копию глобальных параметров модели на своих локальных данных с помощью многопоточности (асинхронно) и периодически вносит вклад в глобальную модель посредством усреднения модели по сети.

Искусственная нейронная сеть с прямой связью (ANN)Модель, также известная как глубокая нейронная сеть (DNN) или многослойный персептрон (MLP), является наиболее распространенным типом глубоких нейронных сетей и единственным типом, который изначально поддерживается в H2O-3.Некоторые другие типы DNN также популярны, такие как сверточные нейронные сети (CNN) и рекуррентные нейронные сети (RNN).MLP хорошо работают на транзакционных (табличных) данных;однако, если у вас есть данные изображения, тогда CNN - отличный выбор.Если у вас есть последовательные данные (например, текст, аудио, временные ряды), то RNN - хороший выбор.

...