Пользовательские среды в OpenAI-Gym - PullRequest
0 голосов
/ 21 февраля 2019

Я хочу попробовать усиленное обучение на Python.Но я хочу создать пользовательскую среду с моими собственными Состояниями и Наградами.

Возможно, я хочу использовать в этом Данные временных рядов (хотя это не так, как акции).Я хочу, чтобы моя система изучала поведение в соответствии со временем, учитывая среду.

Поэтому я бы сначала начал с создания пользовательской среды. Может ли кто-нибудь помочь мне в этом?

1 Ответ

0 голосов
/ 21 февраля 2019

Процесс регистрации среды спортзала OPEN-AI можно найти здесь .

Пожалуйста, пройдите через этот пример пользовательской среды и эту проблему переполнения стекадля получения дополнительной информации.

Возможно, я хочу использовать в этом данные временных рядов (хотя это не так, как акции).Я хочу, чтобы моя система изучала поведение в соответствии со временем, учитывая окружающую среду.

Если вы хотите, чтобы агент изучал время, включите шаг времени в качестве переменной в вашем состоянии.Тогда ваш агент сможет различать два разных состояния, отличных от временного шага.

...