Как правильно получить выходные данные для задания задания метки в формате расширенного файла манифеста для учебного задания? - PullRequest
0 голосов
/ 07 марта 2020

Эта страница: https://docs.aws.amazon.com/sagemaker/latest/dg/augmented-manifest.html имеет простой пример:

{"image-ref": "s3://mybucket/sample01/image1.jpg", "is-a-cat": 1}
{"image-ref": "s3://mybucket/sample02/image2.jpg", "is-a-cat": 0}

и говорит установить AttributeNames в ["image-ref", "is-a-cat"]. Эта страница: https://docs.aws.amazon.com/sagemaker/latest/dg/sms-data-output.html говорит, что ваш выходной файл находится в s3://bucket/labeling-job-name/manifests/output/output.manifest Для моей пользовательской работы по маркировке этот файл имеет следующий формат:

{
    "source-ref": "s3://bucketname/path/filename.png",
    "job-name": {
        "annotationsFromAllWorkers": "{\"image-similarity\":{\"label\":\"Unrecognizable\"}}"
    },
    "job-name-metadata": {
        "type": "groundtruth/custom",
        "job-name": "job-name-20200221002259",
        "human-annotated": "yes",
        "creation-date": "2020-02-21T00:26:31+0000"
    }
}

Итак, вопрос в том, нужно ли мне что-то сделать, чтобы изменить формат вывода в задании на маркировку, или передать какой-либо другой тип данных в AttributeNames, например ["source-ref", "job-name.annotationsFromAllWorkers.image-similarity.label"], или написать другой сценарий для преобразования данных в правильный формат?

...