особенности написания для openai тренажерного зала такси-v2 - PullRequest
0 голосов
/ 05 декабря 2018

Итак, я пытаюсь решить среду такси OpenAI Gym (https://gym.openai.com/envs/Taxi-v2/), используя функциональное обучение. Однако я изо всех сил пытаюсь понять, как к нему подойти.

Я понимаю окружающую среду иГлядя на некоторые примеры в Интернете, я смог понять, как решить проблему с Q-Learning.

Некоторые функции, которые я пытаюсь реализовать:

  • - пассажир на бортутакси
  • кратчайшее расстояние от места такси до места назначения, будь то место пассажира или место назначения пассажира
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...