Как использовать данные трафика из сумо в качестве среды RL для использования в Python? - PullRequest
0 голосов
/ 24 октября 2019

Я пытаюсь использовать Усиление обучения на средствах управления движением. Я заметил, что я должен установить свою среду в первую очередь. Проблема в том, что у меня есть карта, транспортные средства на перекрестках и светофоры, и мне нужно обучить своего агента выполнять действия, основанные на этой среде, и я не знаю, как использовать эти данные о трафике для определения моей среды RL в python,Я действительно ценю, если кто-то может мне помочь с этим. Спасибо.

1 Ответ

0 голосов
/ 24 октября 2019

Если вы уже собрали данные, тогда среда не нужна. Вы будете работать непосредственно с траекториями - последовательностями состояний, действий и вознаграждений.

Для RL вам понадобится сигнал вознаграждения, у вас есть это?

Если вы спрашиваете, как создатьВ среде симуляции существует несколько способов сделать это, но это будет несколько связано. Здесь - это репозиторий, над которым я и другие из моей лаборатории работаем, это среда разработки средств разработки агентов (включая среды моделирования RL) в python, хотя он все еще находится в зачаточном состоянии (извините за бесстыдное "я"продвижение) - мы будем рады серьезному вкладу!

Для полноты картины существуют и другие фреймворки, наиболее заметными из которых являются gym .

...