Я смотрю на игру Seaquest Atari в OpenAI Gym и у меня есть следующий фрагмент кода:
import gym
import time
import random
env = gym.make('Seaquest-v4')
for i_episode in range(10):
seed = (int)(time.time())
random.seed(seed)
env.seed(seed)
observation = env.reset()
for t in range(800):
env.render()
time.sleep(0.01)
action = 0
observation, reward, done, info = env.step(action)
if done:
print("Episode finished after {} timesteps".format(t+1))
break
env.close()
Приведенный выше код отображает 10 игр, хотя я каждый раз сбрасываю начальное значениеуникальный, я до сих пор получаю такой же сценарий игры.В результате агент обучается по тому же сценарию.Может кто-нибудь предложить способ исправить это?Я просто пытаюсь найти способ заставить эмулятор Atari создавать различные сценарии игры.