Проблемы с воспроизведением двухполосного эксперимента по кольцевой дороге - PullRequest
0 голосов
/ 29 февраля 2020

Я изучаю Flow и пытаюсь воспроизвести эксперимент с двумя полосами движения по кольцевой дороге с одним автономным транспортным средством.

Я попробовал ваши настройки эксперимента, следуя статье «Поток: обучение глубокому усилению для контроля в SUMO». Я также попробовал функцию вознаграждения как две нормы скорости всех транспортных средств, но я не могу получить хорошую модель, которая может ослаблять волны остановки и go в системе traffi c. Мне интересно, не могли бы вы поделиться со мной всеми параметрами в вашем эксперименте, такими как параметры в SUMO, параметры обучения RL, архитектуры функции политики и функции crit c и так далее. Или не могли бы вы поделиться со мной кодами, которые вы использовали для обучения, и хорошо обученной моделью, чтобы я мог лучше понять вашу работу.

Большое спасибо!

...