Я пытаюсь проверить, насколько хорош шаг с некоторыми действиями в среде BipedalWalker-v2, но даже если я не вызываю env.render()
, строка _, reward, _, _ = env.step(action)
занимает слишком много времени для запуска.
Кажется, что он пытается заставить робота действительно выполнить шаг, даже если он не появляется на экране.(Я имею в виду, что рендеринг робота на экране занимает некоторое время, но вычисления не должны занимать так много времени, верно?)
Есть ли способ смоделировать шаг, проверяя его вознаграждение?