Я пытаюсь начать учебную работу через запрос REST API, используя пример проекта Census от Googles github.Я могу отправить задание, но оно всегда дает сбой, поскольку я не могу указать, где хранятся файлы обучения и оценки (тестирования), и документации по этому вопросу действительно не хватает - просто указано args[]
.Когда я проверяю журналы в Google ML, появляются следующие ошибки:
task.py: error: the following arguments are required: --train-files, --eval-files
The replica master 0 exited with a non-zero status of 2.
Это мой сформулированный REST-запрос:
{
"jobId": "training_12",
"trainingInput": {
"scaleTier": "BASIC",
"packageUris": ["gs://MY_BUCKET/census.tar.gz"],
"pythonModule": "trainer.task",
"args": ["--train_files gs://MY_BUCKET/adult.data.csv", "--eval_files gs://MY_BUCKET/adult.test.csv"],
"region": "europe-west1",
"jobDir": "gs://MY_BUCKET/",
"runtimeVersion": "1.4",
"pythonVersion": "3.5"
}
}
В рамках args
я пробовал много разных способов указать, где находятся файлы train и eval, но я не смог заставить его работать.Просто для пояснения, я должен использовать REST API для этого варианта использования, а не CLI.
Спасибо
- Обновление -
Я пытался получитьаргументы как --train-files
и --eval-files
, это все еще не работает.
- Обновление 2 - я смог решить эту проблему, сформулировав аргументы как:
"args": [
"--train-files",
"gs://MY_BUCKET/adult.data.csv",
"--eval-files",
"gs://MY_BUCKET/adult.test.csv",
"--train-steps",
"100",
"--eval-steps",
"10"],
Теперь, я получаю новую ошибку, и журналы, кажется, больше не дают информации: "The replica master 0 exited with a non-zero status of 1."
Журналы фактически провели некоторое обучение, и я подозреваю, что это связано ссохранение работы, но я не уверен.