Зачем помощнику по оценке Stable Baselines нужна среда? - PullRequest
0 голосов
/ 09 июля 2020

Модель в Stable Baselines нуждается в среде при ее создании. например,

env = gym.make('CartPole-v1')
model = PPO2(MlpPolicy, env)

Помощник оценки также должен иметь указанную среду. т.е.

mean_reward, std_reward = evaluate_policy(model, env, n_eval_episodes=100)

Какова цель среды, указанной в помощнике оценки, если она уже указана в модели? Среда - обязательный параметр как при создании модели, так и при ее оценке.

Спасибо

...