Эта страница: https://docs.aws.amazon.com/sagemaker/latest/dg/augmented-manifest.html имеет простой пример:
{"image-ref": "s3://mybucket/sample01/image1.jpg", "is-a-cat": 1}
{"image-ref": "s3://mybucket/sample02/image2.jpg", "is-a-cat": 0}
и говорит установить AttributeNames
в ["image-ref", "is-a-cat"]
. Эта страница: https://docs.aws.amazon.com/sagemaker/latest/dg/sms-data-output.html говорит, что ваш выходной файл находится в s3://bucket/labeling-job-name/manifests/output/output.manifest
Для моей пользовательской работы по маркировке этот файл имеет следующий формат:
{
"source-ref": "s3://bucketname/path/filename.png",
"job-name": {
"annotationsFromAllWorkers": "{\"image-similarity\":{\"label\":\"Unrecognizable\"}}"
},
"job-name-metadata": {
"type": "groundtruth/custom",
"job-name": "job-name-20200221002259",
"human-annotated": "yes",
"creation-date": "2020-02-21T00:26:31+0000"
}
}
Итак, вопрос в том, нужно ли мне что-то сделать, чтобы изменить формат вывода в задании на маркировку, или передать какой-либо другой тип данных в AttributeNames
, например ["source-ref", "job-name.annotationsFromAllWorkers.image-similarity.label"]
, или написать другой сценарий для преобразования данных в правильный формат?