Может быть, вы можете взглянуть на S3Fs
Учитывая ваши данные, может быть, такая конфигурация может работать:
import s3fs
fs = s3fs.S3FileSystem(client_kwargs={'endpoint_url': 'fileeast-1.redshift.amazonaws.com',
"aws_access_key_id": "abc",
"aws_secret_access_key": "xyz"})
Чтобы проверить, если вам удастся взаимодействуя с s3, вы можете попробовать следующую команду (NB: изменить somefile.csv
на существующую)
fs.info('s3://bucket/path/file/somefile.csv')
Обратите внимание, что в fs.info
мы начинаем путь с s3
. Если вы не встретите ошибку, вы можете надеяться, что сработает следующая команда:
csvDf = sc.read.csv("s3a://bucket/path/file/*.csv")
На этот раз ваш путь начинается с s3a