Итак, я пытаюсь решить среду такси OpenAI Gym (https://gym.openai.com/envs/Taxi-v2/), используя функциональное обучение. Однако я изо всех сил пытаюсь понять, как к нему подойти.
Я понимаю окружающую среду иГлядя на некоторые примеры в Интернете, я смог понять, как решить проблему с Q-Learning.
Некоторые функции, которые я пытаюсь реализовать:
- - пассажир на бортутакси
- кратчайшее расстояние от места такси до места назначения, будь то место пассажира или место назначения пассажира