Как использовать несколько облачных TPU Google для обучения одной модели - PullRequest
1 голос
/ 16 июня 2019

Мне выделено несколько TPU Google Cloud в регионе us-central1-f.Все типы машин v2-8.

Как я могу использовать все свои блоки TPU для обучения одной модели?

us-cetral1-f регион не поддерживает стручки , поэтому использование стручков не кажетсянравится решение.Даже если были доступны модули, количество имеющихся у меня модулей v2-8 не соответствует ни одному из размеров срезов модуля TPU (16, 64, 128, 256), поэтому я не мог использовать их все в одном модуле.

Ответы [ 2 ]

0 голосов
/ 05 июля 2019

У меня есть те же вопросы, вы получаете доступ из исследовательской облачной программы tenorflow?Если да, мы можем поделиться этой программой для совместной работы.

0 голосов
/ 17 июня 2019

Я считаю, что вы не можете легко сделать это.Если вы хотите обучить одну модель с использованием нескольких TPU, вам необходимо иметь доступ к региону с помощью модулей TPU.В противном случае вы можете сделать очевидную вещь: обучить одну и ту же модель на разных TPU, но с разными гиперпараметрами в качестве способа поиска по сетке ИЛИ вы можете обучить несколько слабых учеников, а затем объединить их вручную.

...