Хорошей отправной точкой для написания собственных пользовательских алгоритмов является учебник Scikit Создание собственного контейнера алгоритмов .Он дает вам обзор Docker, этапов упаковки вашего скрипта в контейнер, загрузки и запуска учебного задания.
Если у вас уже есть файл hdf5, вы можете просто использовать интерфейс командной строки AWS, чтобы загрузить его впринадлежащий вам ведро.
$ aws s3 cp ./path/to/file.h5 s3://my-sagemaker-bucket/folder/file.h5
Затем при создании учебного задания вы можете указать [входной канал]: (http://docs.aws.amazon.com/sagemaker/latest/dg/API_CreateTrainingJob.html#SageMaker-CreateTrainingJob-request-InputDataConfig)
[{
"ChannelName": "train",
"DataSource": {
"S3DataSource": {
"S3Uri": "s3://my-sagemaker-bucket/folder",
"S3DataType": "S3Prefix",
"S3DataDistributionType": "FullyReplicated"
}
}
}]
Когда начнется учебное задание,ваш контейнерный скрипт должен быть в состоянии найти его в своей локальной файловой системе на /opt/ml/input/data/train/file.h5
и прочитать как обычный файл. Обратите внимание, что "train" в этом пути к файлу соответствует имени канала, которое вы указали во входных данных-конфиг.
Вы можете прочитать больше на https://docs.aws.amazon.com/sagemaker/latest/dg/your-algorithms-training-algo.html