Я хочу попробовать усиленное обучение на Python.Но я хочу создать пользовательскую среду с моими собственными Состояниями и Наградами.
Возможно, я хочу использовать в этом Данные временных рядов (хотя это не так, как акции).Я хочу, чтобы моя система изучала поведение в соответствии со временем, учитывая среду.
Поэтому я бы сначала начал с создания пользовательской среды. Может ли кто-нибудь помочь мне в этом?