Вопросы с тегом д-обучение - PullRequest

Вопросы с тегом д-обучение

0 голосов
1 ответ

Я учу агента выйти из лабиринта, собирая все яблоки на своем пути, используя Qlearning. Я читал,...

Catarina Nogueira / 09 ноября 2019
0 голосов
1 ответ

Я сейчас пытаюсь оптимизировать навигацию моего робота. Сначала я использовал ванильный DQN, где...

trello123 / 01 ноября 2019
0 голосов
1 ответ

Я пытаюсь разработать алгоритм q-обучения для обучения с подкреплением, это мой код: import numpy...

student / 29 октября 2019
2 голосов
1 ответ

Я делаю реализацию Q-обучения, в частности уравнения Беллмана. Я использую версию с веб-сайта ,...

Miguel A. Friginal / 20 октября 2019
0 голосов
0 ответов

В такой среде, как бесконечная игра-бегун, где цель состоит в том, чтобы просто остаться в живых...

A Poor / 18 октября 2019
0 голосов
0 ответов

Я пытаюсь ознакомиться с Укреплением Обучения. Я создал RL, используя подход Q-обучения. Описание...

Randy Morrison / 17 октября 2019
3 голосов
0 ответов

Я работаю над проектом, в котором я пытаюсь научить машину вождению с помощью Q-learning в Python....

Viktor Sandberg / 14 октября 2019
0 голосов
0 ответов

Когда скорость обучения α определяется как α k = 1 / k, означает ли k количество выполненных...

user289661 / 07 октября 2019
0 голосов
1 ответ

Я хочу реализовать рекомендацию статьи, используя Q-learning в Python. Наш набор данных содержит,...

Superman / 12 июля 2019
0 голосов
0 ответов

Я попробовал алгоритм DoubleDQN и DQN в игре NChain в спортзале и понял, что производительность...

CA Hau / 05 июля 2019
0 голосов
1 ответ

Я пишу простой пример q-обучения и для обновления q-значений вам нужен maxQ '. Я не уверен,...

yomag1234 / 01 июля 2019
1 голос
1 ответ

Я прочитал несколько материалов о глубоком q-learning, и я не уверен, полностью ли я их понимаю.Из...

mad / 26 июня 2019
2 голосов
1 ответ

Я работаю над изучением q-таблиц и пробежался по простой версии, в которой использовался только...

MNM / 21 июня 2019
0 голосов
0 ответов

Я учусь изучению глубокого подкрепления, начиная с примеров из интернета по решению таких игр, как...

keithc / 18 июня 2019
0 голосов
1 ответ

Я понимаю эпсилон-жадный алгоритм, но есть одна путаница. Это среднее вознаграждение или значение ,...

AgnosticCucumber / 18 июня 2019
0 голосов
1 ответ

Можно ли считать выходные данные одной нейронной сети двумя или более наборами выходов? Я объясню...

Xeyes / 05 июня 2019
0 голосов
1 ответ
0 голосов
0 ответов
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...