Получается, что файл с именем .s3curl
находится в том же каталоге с s3curl.pl
, который содержит идентификатор пользователя и ключ шифрования.
Я перевел его в файл yaml с именем s3.yaml
который содержит:
awsSecretAccessKeys:
mapreduce:
id: <insert id here>
key: <insert key here>
И решение Pythonic:
def download_file_from_s3(s3_server, path, export_path):
url = s3_server + path
with open('s3.yaml') as f:
s3_conf = yaml.load(f.read())['awsSecretAccessKeys']['mapreduce']
now = datetime.now().strftime('%a, %d %b %Y %H:%M:%S +0000')
to_sign = 'GET\n\n\n{}\n{}'.format(now, path)
signature = hmac.new(s3_conf['key'], to_sign, sha1).digest().encode("base64").rstrip('\n')
response = requests.get(url, headers={'Date': now, 'Authorization': 'AWS {}:{}'.format(s3_conf['id'], signature)})
response.raise_for_status()
with open(export_path, 'ab') as f:
for block in response.iter_content(4096):
f.write(block)