Модель в Stable Baselines нуждается в среде при ее создании. например,
env = gym.make('CartPole-v1')
model = PPO2(MlpPolicy, env)
Помощник оценки также должен иметь указанную среду. т.е.
mean_reward, std_reward = evaluate_policy(model, env, n_eval_episodes=100)
Какова цель среды, указанной в помощнике оценки, если она уже указана в модели? Среда - обязательный параметр как при создании модели, так и при ее оценке.
Спасибо