Тренировочные данные на AWS - PullRequest
0 голосов
/ 23 сентября 2019

Я относительно новичок в AWS и пытаюсь проанализировать набор данных о мошенничестве с кредитами, доступных на kaggle.Я использую это, посмотрев на пример, упомянутый в ссылке "https://aws.amazon.com/blogs/machine-learning/preprocess-input-data-before-making-predictions-using-amazon-sagemaker-inference-pipelines-and-scikit-learn/". Я загрузил набор данных моей кредитной карты в корзину s3 и сделал следующее

import boto3 
import botocore 
import pandas as pd
import sagemaker
from sagemaker import get_execution_role 
role = get_execution_role() 
bucket = '<mybucket>' 
prefix = 'test'
key = 'creditcard.csv' 
data_location = 's3://{}/{}/train/{}'.format(bucket,prefix,key)  
output_location = 's3://{}/{}/output'.format(bucket, prefix)
containers = {
          <mycontainer>
          }
sess = sagemaker.Session()
linear = sagemaker.estimator.Estimator(containers[boto3.Session().region_name],
                                   role, 
                                   train_instance_count=1, 
                                   train_instance_type='ml.c4.xlarge',
                                   output_path=output_location,
                                   sagemaker_session=sess)
linear.set_hyperparameters(feature_dim=31,
                       predictor_type='binary_classifier',
                       mini_batch_size=50)
linear.fit({'train': data_location})

Когда я пытаюсьЗапустите этот код, появится сообщение об ошибке, показывающее: «Либо обучающий канал пуст, либо размер мини-пакета слишком велик.Убедитесь, что данные обучения содержат непустые файлы, а размер мини-пакета меньше числа записей на хост обучения. «В моих данных обучения нет пустых файлов. Как устранить эту ошибку? * Я загрузил набор данныхс моего компьютера и хранится в моем контейнере внутри папки с именем test * Контейнер является стандартным контейнером, используемым для линейного ученика * Я думаю, что я каким-то образом не смог подключить файл из s3 bucket к созданному мной экземпляру ноутбука. Может ли кто-нибудь проверить, что

...