Неизвестная ошибка: не удалось запустить сервер gRPC, Tensorflow на кластере Raspberry Pi - PullRequest
0 голосов
/ 31 октября 2019

Я пытаюсь запустить дистрибутив TensorFlow на кластере Raspberry Pi. Использование RPi4 в качестве главного узла и трех RPi3 в качестве рабочего узла. Я пытаюсь запустить TensorFlow's train.py для распространения обучения. К сожалению, набор параметров предназначен для одного Raspberry Pi, а не для кластера. Моя проблема пытается установить параметры для кластерных вычислений. Я использую mpi4py для создания своего кластера и использую его для распределения работы. Каждый раз, когда я пытаюсь запустить train.py, независимо от того, какие параметры я установил, я всегда получаю сообщение об ошибке «Не удалось запустить сервер gRPC».

Я пытался установить параметры вручную, используя руководство из https://planspace.org/20170410-tensorflow_clusters_questions_and_code/ но мне не повезло.

...