Облачные инструменты TPU не генерируют профиль - PullRequest
0 голосов
/ 16 мая 2018

Я следовал инструкциям Cloud TPU Tools . За исключением шага 4, где вы должны изменить --tpu_name на --tpu, кажется, что все работает так, как ожидалось.

Не удалось создать вкладку «Профиль». Я выполнил

capture_tpu_profile --tpu_name=$TPU_NAME --logdir=${model_dir}

, который произвел

Welcome to the Cloud TPU Profiler v1.6.0
Starting to profile TPU traces for 2000 ms. Remaining attempt(s): 3
Limiting the number of trace events to 1000000
Profile session succeed for host(s):10.240.1.2

Я обновлял / перезапускал TensorBoard несколько раз, но там нет вкладки «Профиль», и нажатие «Профиль» в раскрывающемся меню не возвращает сгенерированные данные.

Это известная проблема с профилировщиком Cloud TPU?

- Правка 1 -

В Profiler v 1.5.2 не удалось собрать события трассировки.

Welcome to the Cloud TPU Profiler v1.5.2
Starting to profile TPU traces for 2000 ms. Remaining attempt(s): 3
Limiting the number of trace events to 1000000
No trace event is collected. Automatically retrying.

Starting to profile TPU traces for 2000 ms. Remaining attempt(s): 2
Limiting the number of trace events to 1000000
No trace event is collected. Automatically retrying.

Starting to profile TPU traces for 2000 ms. Remaining attempt(s): 1
Limiting the number of trace events to 1000000
No trace event is collected after 3 attempt(s). Perhaps, you want to try again (with more attempts?).
Tip: increase number of attempts with --num_tracing_attempts.

1 Ответ

0 голосов
/ 17 мая 2018

Можете ли вы повторить попытку, используя Cloud TPU Profiler 1.5.2 ?

pip install cloud-tpu-profiler == 1.5.2

Облачный профилировщик TPU 1.6.0 и функция списка рабочих поддерживаются только в текущей основной ветке tenorflow, хотя он обратно совместим с tf-1.8 при использовании следующей команды capture_tpu_profile —service_addr = 10.240.1.2 —logdir = $ {model_dir}

...