Я хочу обучить политике, которая зависит от времени.Например, я хотел бы знать цену продукта с течением времени, то есть ценовую политику от t = 1 до t = T.
Должен ли я инициализировать ценовую политику от t = 1 до t= Т в начале?Как мне инициализировать это в DDPG?