AWS Sagemaker: AttributeError: модуль 'pandas' не имеет атрибута 'core' - PullRequest
0 голосов
/ 23 октября 2018

Позвольте мне добавить префикс, сказав, что я новичок в tenorflow и еще новее в AWS Sagemaker.

У меня есть некоторый код tenorflow / keras, который я написал и протестировал на локальном докеризированном ноутбуке Jupyter, и он работаетхорошо.В нем я импортирую файл csv в качестве входных данных.

Я использую Sagemaker, чтобы раскрутить экземпляр ноутбука jupyter с помощью conda_tensorflow_p36.Я изменил код pandas.read_csv () так, чтобы он указывал на мой входной файл, теперь размещенный в корзине S3.

Поэтому я изменил эту строку кода с

import pandas as pd

data = pd.read_csv("/input.csv", encoding="latin1")

на

import pandas as pd

data = pd.read_csv("https://s3.amazonaws.com/my-sagemaker-bucket/input.csv", encoding="latin1")

и я получаю эту ошибку

AttributeError: module 'pandas' has no attribute 'core'

Я не уверен, что это проблема с разрешениями.Я читаю это, пока я называю свое ведро строкой "sagemaker", оно должно иметь к нему доступ.

1 Ответ

0 голосов
/ 23 октября 2018

Извлеките наши данные из S3, например:

import boto3
import io
import pandas as pd


# Set below parameters
bucket = '<bucket name>'
key = 'data/training/iris.csv'
endpointName = 'decision-trees'

# Pull our data from S3
s3 = boto3.client('s3')
f = s3.get_object(Bucket=bucket, Key=key)

# Make a dataframe
shape = pd.read_csv(io.BytesIO(f['Body'].read()), header=None)
...