Поиск (Python) проекта, который сравнивает обучение в области подкрепления с DeepRL - PullRequest
0 голосов
/ 19 января 2019

Существует обучение по подкреплению без какой-либо нейронной сети (например, Q-Learning), и есть обучение по глубокому подкреплению (например, Deep Q-Learning).

Есть ли уже проект, который обеспечивает сравнение двух подходов к одной и той же проблеме?Может быть, небольшой проект Python или пост в блоге, о котором я не знаю ...

Я нахожу только магистерскую диссертацию по этой теме, но без кода, см .:

https://www.kth.se/social/files/58865ec8f27654607fb6e9a4/PFinnman_MWinberg_dkand16.pdf?fbclid=IwAR0PDJHx6e04xtamDG7IjHWIZAcdP2Qg_xsgJO0G0_kHWPVgVFS99eePP7g

1 Ответ

0 голосов
/ 19 января 2019

Возможно, вы слышали о Саттон-Барто книге о подкреплении-обучении-введении .В этой книге вы найдете множество примеров: Q обучения с использованием table, а также с neural-network.

. Также есть сравнение между многими другими алгоритмами, такими как SARSA, TD, Q,value-function и т. д. В этой ссылке вы найдете хранилище кода, в котором есть решение практически всех проблем из книги.

Не стесняйтесь задавать вопросы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...