Войти
Запомнить
Регистрация
PullRequest
Лента
Топ
Теги
Новая
Новая
Вопросы с тегом марковского-процесса-принятия-процесса
0
голосов
1
ответ
В обучении с подкреплением, у агента и среды разные состояния или только одно?
vaibhav
/
17 февраля 2020
машина-обучения
усиление-обучения
марковского-процесса-принятия-процесса
mdp
0
голосов
1
ответ
Подходит ли алгоритм градиента политики под модельным или основанным на модели методам в обучении подкреплению?
vaibhav
/
14 февраля 2020
усиление-обучения
марковского-процесса-принятия-процесса
mdp
1
голос
2
ответов
Почему проблема бандитов также называется MDP с одним шагом / состоянием в обучении подкреплению?
vaibhav
/
11 февраля 2020
машина-обучения
усиление-обучения
марковского-процесса-принятия-процесса
mdp
бандит
0
голосов
0
ответов
[MDP]: Как рассчитать оптимальное значение для продолжающейся задачи?
Привет, Мы узнали, как рассчитать V * для эпизодических задач, более конкретно, задачи с конечным...
rodan
/
29 октября 2019
усиление-обучения
марковского-процесса-принятия-процесса
Для получения более полной информации посмотрите в
списке вопросов
или в
популярных тегах
.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...