Question

Я читал о том, как использовать векторизованные среды с модулем SubProcVenv из здесь и здесь .

Однако все примеры, которые я могу найти, используют стабильные базовые показатели (модели openai), и я не могу найти способ сделать это с моей пользовательской моделью.

Можно ли это сделать? И как так?

Senthamizhan · Answer 1 · 06 марта 2020

Это можно сделать, как указано в записной книжке Colab. Я не уверен, с какой проблемой вы сталкиваетесь. Способ, который я реализовал для своей пользовательской среды:

# Instantiate the env
env = customEnv()

# Wrap it
env = DummyVecEnv([lambda: env])

EPISODES = 5000
# Instantiate and learn using stable-baselines
model = PPO2('MlpPolicy', env).learn(EPISODES)

Я уверен, что вы можете сделать то же самое и для SubProcVenv. Go для SubProcVenv только , если вы хотите использовать многопроцессорность.

Вектор Env с пользовательской моделью

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Вектор Env с пользовательской моделью

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы