Застрял в модели обучения питомца в Google Cloud - PullRequest
0 голосов
/ 15 октября 2018

Я следовал этому учебнику.

Для учебного набора данных Pets в Google Cloud.Я сделал каждый шаг, и моя учебная команда выглядит следующим образом: -

gcloud ml-engine jobs submit training `whoami`_object_detection_pets_`date +%m_%d_%Y_%H_%M_%S` \
    --runtime-version 1.8 \
    --job-dir=gs://${datastoremd1}/model_dir \
    --packages dist/object_detection-0.1.tar.gz,slim/dist/slim-0.1.tar.gz,/tmp/pycocotools/pycocotools-2.0.tar.gz \
    --module-name object_detection.model_main \
    --region us-central1 \
    --config object_detection/samples/cloud/cloud.yml \
    -- \
--model_dir=gs://${datastoremd1}/model_dir \
--pipeline_config_path=gs://${datastoremd1}/data/faster_rcnn_resnet101_pets.config 

datastoremd1 - это имя моего Bucket.

Приходит следующая ошибка: -

Реплика ps 0 вышла с ненулевым состоянием 1. Причина завершения: ошибка.Реплика ps 1 вышла с ненулевым статусом 1. Причина прекращения: Ошибка

Я искал различные источники и нашел решение, в котором человек говорит, что мы должны внести изменения в yamlфайл, поэтому я изменил runtimeVersion на 1.4 (как указано в этом решении).

Также внесены некоторые изменения в файле setup.py.В одном шаге человек говорит, что нужно внести изменения в файл object_detection /valuator.pyНо там нет файла valuator.py.

Решение Я следовал.

Какое может быть решение проблемы?

...