У меня есть два файла CSV, один размером около 60 ГБ, а другой - около 70 ГБ в S3. Мне нужно загрузить оба CSV-файла в pandas фреймы данных и выполнить такие операции, как соединения и слияния данных.
У меня есть экземпляр EC2 с достаточным объемом памяти для загрузки обоих фреймов данных в память
Как лучше всего прочитать этот огромный файл из S3 в pandas фрейм данных?
Кроме того, после выполнения необходимых операций с фреймами данных выходной фрейм данных должен быть повторно -загружено на S3.
Каков наилучший способ загрузки огромного CSV-файла на S3?