Зачем разворачивать тренажерный зал openAI? - PullRequest
0 голосов
/ 18 декабря 2018

Я пытаюсь получить представление об обучении с подкреплением, используя тренажерный зал openAI в качестве учебной среды.Я делаю это, читая книгу Практическое обучение усилению с Python .В этой книге приведен некоторый код.Часто код не работает, потому что мне нужно сначала развернуть его, как показано в: openai gym env.P, объект TimeLimit AttributeError не имеет атрибута 'P'

Тем не менее, меня лично все еще интересует, ПОЧЕМУ эта развёртка.Почему вам нужно развернуть?Что это делает именно?И почему это не закодировано в книге?Это устаревшее программное обеспечение, как предположил Джулиов?

Заранее спасибо.

1 Ответ

0 голосов
/ 19 декабря 2018

Открытый AI Gym предлагает множество различных сред.Каждый из них со своим набором параметров и методов.Тем не менее они, как правило, заключены в один класс (например, интерфейс для реальных OOPL), называемый Env.Этот класс предоставляет наиболее распространенные методы для любой среды, такие как step, reset и seed.Класс «interface» - это замечательно, потому что он позволяет вашему коду быть независимым от среды.Это также упрощает процесс тестирования одного агента в разных средах.

Однако, если вы хотите получить доступ к динамике "за кадром" в конкретной среде, используйте unwrappedсвойство.

...