Вопросы с тегом армирование обучения - PullRequest

Вопросы с тегом армирование обучения

1 голос
1 ответ

Пока я внедрял агентов для решения различных проблем ... Я видел, что потери моего актера снижаются...

Kaus / 19 сентября 2019
0 голосов
2 ответов

Можно ли использовать «обучение с подкреплением» или цикл обратной связи на контролируемой модели?...

Mohamed Aziz Tousli / 11 июля 2019
1 голос
0 ответов

Здравствуйте, сообщество StackOverflow! У меня возник вопрос по поводу алгоритмов прогнозирования и...

dummyHead / 06 июня 2019
0 голосов
0 ответов
0 голосов
0 ответов
0 голосов
1 ответ

Как работает приведенный ниже расчет?

Tamra.y / 02 июня 2019
0 голосов
0 ответов

Мой вопрос: Можем ли мы внедрить онлайн-обучение по подкреплению в облаке? Я имею в виду, например,...

Sam / 15 мая 2019
0 голосов
0 ответов

Я занимаюсь проектом, который автоматически контролирует набор включений и выключений чиллеров и...

timothy50506 / 25 апреля 2019
1 голос
1 ответ

Я читаю книгу «ИИ для разработчиков игр» Гленна Симанна и Дэвида М. Бурга, где они используют ИИ...

iaskdumbstuff / 12 апреля 2019
1 голос
0 ответов

Я очень плохо знаком с машинным обучением.Я нашел этот пример на Github: Код Я реализовал функцию...

Tobias M. / 03 апреля 2019
2 голосов
0 ответов

У меня проблемы с алгоритмом REINFORCE в керасе с играми Atari.После раунда около 30 эпизодов сеть...

tk338 / 29 марта 2019
1 голос
1 ответ

Мне интересно, почему Оптимизация Политики Трастового Региона является алгоритмом On-policy? По...

zhangyh / 27 марта 2019
1 голос
0 ответов

Я уже некоторое время использую OpenAI Retro, и я хотел поэкспериментировать с играми для двух...

niallmandal / 13 марта 2019
0 голосов
1 ответ

Я играю с созданием самостоятельной машины в компьютерную игру.Я думал об использовании обучения с...

DaveS / 12 февраля 2019
0 голосов
2 ответов

Задача Моя цель - применить Reinforcement Learning для прогнозирования следующего состояния объекта...

maurocomi / 05 января 2019
0 голосов
1 ответ

У меня проблема с результатами, полученными при выполнении итерации значений, с числами, растущими...

Tom F / 09 декабря 2018
0 голосов
1 ответ
0 голосов
2 ответов

Допустим, у нас есть бот, у которого есть немного денег и несколько акций.Вводится список цен за...

Arpan Dhatt / 11 июня 2018
0 голосов
1 ответ

Я пытаюсь реализовать сетевой агент политики для игры 2048 согласно учебнику Карпати RL . Я знаю,...

Gogis / 04 мая 2018
0 голосов
1 ответ

Я новичок в области обучения подкреплению и пытался реализовать DQN для решения задачи CartPole-v0...

ashboy64 / 02 мая 2018
0 голосов
1 ответ
3 голосов
2 ответов

Как использовать деревья MinMax с Q-Learning? Я хочу реализовать агент Q-Learning connect 4 и...

Vadiklk / 10 января 2012
5 голосов
1 ответ

У меня проблемы с пониманием алгоритма SARSA: http://en.wikipedia.org/wiki/SARSA В частности, при...

Neutralise / 22 мая 2011
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...