Вопросы с тегом армирование обучения

2 голосов

2 ответов

Я начал играть с обучением подкреплению (используя книгу Саттона). Я не могу до конца понять, что...

Carlo V. Dango / 16 февраля 2011

7 голосов

1 ответ

Мне нравится проводить неполный рабочий день в изучении подкрепления. В последние годы (до 2009...

PeanutButterJelly / 20 октября 2010

6 голосов

3 ответов

Какая разница в алгоритме имеет большое или маленькое значение гаммы? В моей оптике, если оно не...

devoured elysium / 06 декабря 2009

5 голосов

3 ответов

Давайте предположим, что мы находимся в комнате, где наш агент может двигаться вдоль осей xx и yy....

devoured elysium / 04 декабря 2009

1 голос

1 ответ

Давайте представим, что у нас есть плоскость (x, y), по которой робот может двигаться. Теперь мы...

devoured elysium / 03 декабря 2009

1 голос

1 ответ

В настоящее время я использую Q-Learning, чтобы попытаться научить бота двигаться в комнате,...

devoured elysium / 13 ноября 2009

1 голос

1 ответ

Мне нужно поработать с Q Learning о парне, который должен передвигать мебель по дому (в основном...

devoured elysium / 09 октября 2009