Агент TF не обучен должным образом, распределенный сбор данных с большим запросом - PullRequest
0 голосов
/ 26 февраля 2020

Привет. Я пытаюсь выучить ML. Я делаю распределенный сбор данных на примере тележки агента TF DQN.

Вот ссылка на оригинальный пример: https://github.com/tensorflow/agents/blob/master/docs/tutorials/1_dqn_tutorial.ipynb

Здесь ' ссылки на мой код:

Файл 1: re F1 BigQuery w Bucket: Соберите Data.ipynb

Файл 2: re F2 BigQuery w Bucket: Train.ipynb

Я подозреваю, что проблема в разделе больших запросов, потому что я смог тренироваться с хранением данных на диске Google и хранением политик в облаке ведро. Однако я не могу определить, в чем проблема с большим запросом.

Мой агент не учится на тренинге. Среднее вознаграждение от оценки после обучения по 20 политикам должно составлять около 200, однако, моя - около 9 за все время.

Я был бы признателен за любую помощь или понимание того, почему это не тренируется должным образом, чтобы вернуть меня в нужное русло. Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...