У меня есть очень большой файл с разделителями столбцов, выходящий из отчета базы данных примерно так:
field1,field2,field3,metricA,value1
field1,field2,field3,metricB,value2
Я хочу, чтобы в новом файле были строки комбинирования, подобные этой:
field1,field2,field3,value1,value2
Я могу сделать это, используя хэш. В этом примере первые три поля являются ключом, и я объединяю value1 и value в определенном порядке, чтобы быть значением. После прочтения файла я просто распечатываю ключи и значения хеш-таблицы в другом файле. Работает нормально.
Однако у меня есть некоторые опасения, так как мой файл будет очень большим. Около 8 ГБ на файл.
Был бы более эффективный способ сделать это? Я имею в виду не скорость, а объем памяти. Я обеспокоен тем, что этот процесс может умереть из-за проблем с памятью. Я просто рисую пробел с точки зрения решения, которое будет работать, но не затолкает все в, в конечном итоге, в очень большой хэш.
Для полного раскрытия, я использую ActiveState Perl в Windows.