Привет. Я пытаюсь выучить ML. Я делаю распределенный сбор данных на примере тележки агента TF DQN.
Вот ссылка на оригинальный пример: https://github.com/tensorflow/agents/blob/master/docs/tutorials/1_dqn_tutorial.ipynb
Здесь ' ссылки на мой код:
Файл 1: re F1 BigQuery w Bucket: Соберите Data.ipynb
Файл 2: re F2 BigQuery w Bucket: Train.ipynb
Я подозреваю, что проблема в разделе больших запросов, потому что я смог тренироваться с хранением данных на диске Google и хранением политик в облаке ведро. Однако я не могу определить, в чем проблема с большим запросом.
Мой агент не учится на тренинге. Среднее вознаграждение от оценки после обучения по 20 политикам должно составлять около 200, однако, моя - около 9 за все время.
Я был бы признателен за любую помощь или понимание того, почему это не тренируется должным образом, чтобы вернуть меня в нужное русло. Спасибо.