У меня есть файл CSV 10 ГБ. Я могу поместить файл в S3 двумя способами.
1) Загрузить весь файл в один объект CSV.
2) Разделить файл на несколько частей (скажем, 200 МБ) и загрузить.
Теперь мне нужно собрать все данные в объекте во фрейм данных pandas, который выполняется на экземпляре EC2.
1) Один из способов - сделать один запрос и получить файл, если он должен быть одним большим файлом и поместить данные в фрейм данных.
2) Другой способ - сделать несколько запросов для каждого объекта и продолжать добавлять данные в фрейм данных.
Какой лучший способ сделать это?