Как исправить пакет тренера, не найденный в обучающей работе по распределению по графическому процессору AI Platform - PullRequest
0 голосов
/ 07 июня 2019

Я пытаюсь обучить Оценщик Tensorflow на платформе AI.Модель обучается на локальном языке очень хорошо, хотя и очень медленно, но когда я пытаюсь запустить обучение распределенному графическому процессору на платформе AI, я сталкиваюсь с этой ошибкой:

CommandException: No URLs matched: gs://path/.../trainer-0.1.tar.gz

Мой код упакован с trainer модуль, рекомендованный Google Cloud AI Platform.Любая помощь будет оценена!

1 Ответ

0 голосов
/ 12 июня 2019

Я действительно смог исправить свою проблему: похоже, что если я не настрою промежуточное ведро, то каталог модели, в котором хранятся контрольные точки, перезапишет пакет тренера, прежде чем рабочие реплики смогут загрузить тренера!Я не уверен, как контрольные точки могли даже начать сохраняться, когда рабочие реплики еще не все загрузили трейнер, но добавление промежуточной корзины, отличной от моей модели dir, исправило это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...