Я использую несколько семян для инициализации OpenAI
условий в тренажерном зале, так как я хочу сравнить два метода RL. Однако я забыл точные семена, которые соответствуют каждой из сред. Есть ли способ восстановить эти семена, кроме повторного обучения с теми же семенами и сравнения тренировочных кривых?
Я проверил источник сред. Здесь можно найти код метода seed
, который инициализирует начальное значение, вызвав другой метод (np_random
) из файла gym.utils/seeding
.
Я также проверил этот код и обнаружил, что ни на одном из этих этапов семя не сохраняется. Таким образом, кажется, что когда он инициализирован, он забыт навсегда.
Опять же, поскольку я сохранил тренировочные кривые, я могу сравнить с новыми, чтобы определить, является ли начальное число одинаковым. Тем не менее, мне интересно, есть ли более простой способ сделать это.
Это строки, которые я использую для настройки среды:
class System:
def __init__(self, memory_capacity = 200000, env_steps=1, grad_steps=1, init_steps=1000, reward_scale = 25,
temperature=1.0, soft_lr=5e-3, batch_size=3000, hard_start = False, original_state=True, n_seed=0, system='Hopper-v2'):
self.env = gym.make(system).unwrapped
self.env.reset()
self.env.seed(n_seed)