Question

Я пытаюсь использовать Усиление обучения на средствах управления движением. Я заметил, что я должен установить свою среду в первую очередь. Проблема в том, что у меня есть карта, транспортные средства на перекрестках и светофоры, и мне нужно обучить своего агента выполнять действия, основанные на этой среде, и я не знаю, как использовать эти данные о трафике для определения моей среды RL в python,Я действительно ценю, если кто-то может мне помочь с этим. Спасибо.

BenedictWilkinsAI · Answer 1 · 24 октября 2019

Если вы уже собрали данные, тогда среда не нужна. Вы будете работать непосредственно с траекториями - последовательностями состояний, действий и вознаграждений.

Для RL вам понадобится сигнал вознаграждения, у вас есть это?

Если вы спрашиваете, как создатьВ среде симуляции существует несколько способов сделать это, но это будет несколько связано. Здесь - это репозиторий, над которым я и другие из моей лаборатории работаем, это среда разработки средств разработки агентов (включая среды моделирования RL) в python, хотя он все еще находится в зачаточном состоянии (извините за бесстыдное "я"продвижение) - мы будем рады серьезному вкладу!

Для полноты картины существуют и другие фреймворки, наиболее заметными из которых являются gym .

Как использовать данные трафика из сумо в качестве среды RL для использования в Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как использовать данные трафика из сумо в качестве среды RL для использования в Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы