Я работаю над скриптом Python для анализа файлов журнала Squid (http://www.squid -cache.org /).В то время как журналы чередуются каждый день, чтобы они не становились большими, к концу каждого дня они достигают 40-90 МБ.
По сути, я занимаюсь чтением файла построчно, анализируянеобходимые мне данные (IP, запрашиваемый URL, время) и добавление их в базу данных sqlite.Однако, похоже, это занимает очень много времени (сейчас он работает более 20 минут)
Итак, очевидно, что перечитать файл невозможно.Что я хотел бы сделать, это прочитать файл, а затем обнаружить все новые записанные строки.Или, что еще лучше, в начале дня сценарий будет просто считывать данные в режиме реального времени по мере их добавления, чтобы никогда не было длительного времени обработки.
Как мне поступить так?