Использование TPU на Cloud ML Engine - PullRequest
0 голосов
/ 17 января 2019

Я пытаюсь использовать TPU в Cloud ML Engine, но не знаю, как мне предоставить аргумент tpu, которого ожидает TPUClusterResolver.

Это среда, которую я использую:

--python-version 3.5 \
--runtime-version 1.12 \
--region us-central1 \
--scale-tier BASIC_TPU

Сбой задания с:

ValueError: Please provide a TPU Name to connect to.

Как отдельная проблема - движок ML, похоже, сам добавляет --master grpc://10.129.152.2:8470 в мою работу, что также приводит к сбою работы. В качестве обходного пути я просто добавил неиспользуемый главный флаг в свой код.

1 Ответ

0 голосов
/ 26 января 2019

это была известная проблема во время выполнения 1.11 и 1.12, и она была исправлена.Теперь служба не добавит --master в ваше учебное приложение.Вы должны продолжать использовать TpuClusterResolver.

...