У меня есть 10 файлов CSV, каждый из которых составляет около 40-60 ГБ.Я хотел узнать наиболее эффективный способ без использования Spark / Hadoop, чтобы сделать что-то вроде нарезки CSV на основе условия и сохранить их как CSV.
Например, рассмотрим таблицу Machine_Details + -------------- + -------- + -------- +
|Machine_Name |Значение1 |Value2 |
+ -------------- + -------- + -------- +
|1203 |0,11 |0,22 |
|1203 |0,21 |0,23 |
|1205 |0,21 |0,45 |
+ -------------- + -------- + -------- +
Что янеобходимо, чтобы все строки, связанные с именем машины 1203, были помещены в один CSV, и аналогично все строки с именем машины 1205 должны быть помещены в другой файл CSV