Мне нужен совет по синтаксическому анализу большого текстового файла - размером 6 ГБ.
Что я сделал, так это загрузил всю мою почту Gmail с помощью Thundervird. Теперь у меня есть файл mbox со всей моей электронной почтой - это текстовый файл.- размером 6 ГБ
Мне нужно проанализировать этот файл и извлечь конкретные данные, которые следуют определенному шаблону
Первый вопрос : какой язык использовать?Я искал некоторые другие темы, похожие на это, и понимаю, что Perl или Python (и один или два других) будут в порядке
Второй вопрос, хотя : я прочитал в одном из ответов на постчто может быть лучше загрузить текстовый файл в базу данных и позволить базе данных выполнять поиск по текстовому файлу?
Мне нужно сгенерировать CSV в качестве вывода
Итак ...для меня было бы разумнее пойти по маршруту БД?
Третий вопрос : Как долго это кусок строки ... я имею в виду ... сколько времени потребуется, чтобы пройти через мойФайл 6Gb ... ОК, без каких-либо подробностей ответить невозможно!
Мне нужно вытащить следующие данные:
First Name:
Last Name:
Address:
Telephone:
Mobile:
Email:
Итак ... Мне нужно знать, нужно ли мнечтобы запустить скрипт и оставить мою машину включенной на ночь, я не уверен, действительно ли вышеупомянутое - действительно тупой вопрос или нет - но я решил спросить в любом случае
ЛЮБЫЕ ответы были бы отличными
Спасибо
Омар