Задача:
Обработайте 3 текстовых файла размером около 1 ГБ и превратите их в файлы CSV. Исходные файлы имеют собственную структуру, поэтому регулярные выражения были бы полезны.
Проблема:
Нет проблем. Я использую php для этого, и это нормально. На самом деле мне не нужно обрабатывать файлы быстрее. Мне просто любопытно, как бы вы подошли к проблеме в целом. В конце я хотел бы увидеть простые и удобные решения, которые могут работать быстрее, чем php.
@ феликс
Я уверен в этом. :) Если я закончу весь проект, я, вероятно, опубликую это как пинг-понг с межязыковым кодом.
@ знак
Мой подход в настоящее время работает так, за исключением того, что я кэширую несколько сотен строк, чтобы сохранить низкую запись в файл. Хорошо продуманный обмен памятью, вероятно, выжмет некоторое время. Но я уверен, что другие подходы могут намного превзойти php, как полное использование * nix toolset.