Какова ваша общая цель здесь, хотя? Люди помогают с тем, как читать, но что тогда? Вы хотите сделать объединение / слияние? Вам нужно больше трюков, чтобы пройти через это.
Но что тогда? Остальная часть вашего алгоритма тоже чанкна? У вас будет достаточно ОЗУ для обработки чего-либо? А как насчет производительности процессора? Достаточно ли одного маленького i7? Вы планируете часы или дни ожидания для результатов? Конечно, все это может быть приемлемо для вашего варианта использования, но мы этого не знаем.
В определенный момент, если вы хотите использовать большие данные, вам нужны большие компьютеры. Вы действительно должны сделать это на месте? Даже если вы не готовы к распределенным вычислениям по кластерам, вы можете просто получить экземпляр виртуальной машины соответствующего размера. Ваша компания заплатит за это. Они платят за себя. Гораздо дешевле дать вам лучший компьютер, чем платить за то, что вы подождете, пока маленький компьютер не достигнет 1008 *. В Индии цена крысы ios между затратами на рабочую силу / AWS ниже, чем в США, конечно, но она все еще стоит того. Будь как эй босс, ты хочешь, чтобы это заняло 3 дня или 3 недели?
Реально, ваши проблемы с маленьким компьютером только ухудшатся после чтения в CSV. Я имею в виду, я не знаю ваш вариант использования, но это кажется вероятным. Вы можете потратить много времени, пытаясь найти выход из этих проблем, но гораздо дешевле просто раскрутить экземпляр EC2.