Сохранить последнюю позицию
Когда вы закончите анализ файла журнала, сохраните позицию в таблице вашей базы данных, которая ссылается как на полный путь к файлу, так и на позицию.,Когда вы запускаете анализатор через 5 минут, вы запрашиваете в базе данных журнал, который вы собираетесь анализировать, извлекаете позицию и начинаете оттуда.
Сохраните первую строку данных
Если у вас есть ротация журнала, добавьте дополнительный ключ в базу данных, которая будет содержать первую строку файла журнала.Поэтому, когда вы начинаете с файла, сначала прочитайте первую строку.Когда вы запрашиваете базу данных, вам нужно проверить первую строку, а не имя файла.
Первая строка всегда должна быть уникальной, поскольку у вас есть временная метка.Но не забывайте, что файл журнала, совместимый с W3C, обычно записывает заголовки в начале файла.Таким образом, первая строка должна быть первой строкой данных.
Сохраните только те данные, которые вам нужны
При анализе W3C очень легко прочитать отправленные байты.Разбор будет очень быстрым, если вы сохраните только эту информацию.Сохраните его в своей базе данных, либо обновив существующую строку в своей базе данных, либо добавив новую строку с отметкой времени, которую вы можете объединить с другими позже в запросе.
Не изобретать зановоwheel
Если то, что вы делаете, не является очень конкретным, я рекомендую вам скачать парсер с открытым исходным кодом в Интернете.http://awstats.sourceforge.net/