Я начал играть с обучением подкреплению (используя книгу Саттона). Я не могу до конца понять, что...
Мне нравится проводить неполный рабочий день в изучении подкрепления. В последние годы (до 2009...
Какая разница в алгоритме имеет большое или маленькое значение гаммы? В моей оптике, если оно не...
Давайте предположим, что мы находимся в комнате, где наш агент может двигаться вдоль осей xx и yy....
Давайте представим, что у нас есть плоскость (x, y), по которой робот может двигаться. Теперь мы...
В настоящее время я использую Q-Learning, чтобы попытаться научить бота двигаться в комнате,...
Мне нужно поработать с Q Learning о парне, который должен передвигать мебель по дому (в основном...