Question

Аналитическая команда моей компании каждый день загружает файл CSV на S3, размер которого обычно составляет 300 МБ, но постоянно увеличивается. Лямбда-функция, которую я должен реализовать, должна прочитать этот файл и обработать каждую строку.

Моя главная проблема в том, что большой размер файла может вызвать проблемы с памятью в контексте выполнения моей лямбды. Можно ли с помощью boto3 загрузить этот файл из S3 в виде потока и прочитать его во время загрузки? Если нет, какой подход я должен использовать для решения этой ситуации?

Заранее спасибо.

David Jiménez Martínez · Answer 1 · 28 июня 2018

В ответ на мой вопрос я только что нашел smart-open: https://github.com/RaRe-Technologies/smart_open/tree/master/smart_open,, который очень изящно справляется с моей проблемой.

Загрузка большого текстового файла из S3 с помощью boto3

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Загрузка большого текстового файла из S3 с помощью boto3

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов