RLIB Несколько Агентов с различными тренировочными алгоритмами - PullRequest
1 голос
/ 24 февраля 2020

В RLLIB возможно ли иметь несколько агентов с разными алгоритмами обучения? (пример: один агент, использующий DQN, и один агент, использующий Q-Learning)?

1 Ответ

1 голос
/ 25 февраля 2020

Да, это возможно. См. Этот пример из документации :

trainer = pg.PGAgent(env="my_multiagent_env", config={
"multiagent": {
    "policies": {
        # the first tuple value is None -> uses default policy
        "car1": (None, car_obs_space, car_act_space, {"gamma": 0.85}),
        "car2": (None, car_obs_space, car_act_space, {"gamma": 0.99}),
        "traffic_light": (None, tl_obs_space, tl_act_space, {}),
    },
    "policy_mapping_fn":
        lambda agent_id:
            "traffic_light"  # Traffic lights are always controlled by this policy
            if agent_id.startswith("traffic_light_")
            else random.choice(["car1", "car2"])  # Randomly choose from car policies
}, })



while True:
     print(trainer.train())

, в которой каждый имеет свой алгоритм PG.

...