Почему журнал доступа веб-сервера Apache будет иметь неправильный формат? - PullRequest
3 голосов
/ 13 марта 2012

в классе, нам было поручено проанализировать журнал доступа и записать все успешные попытки.При исследовании журнала доступа к веб-серверу Apache я натолкнулся на несколько случаев, примерно 3/100 000 записей о том, что формат был неправильным.Журнал будет выглядеть, например, как 96.45.3.2 - - [14/Mar/2011:00:12:33 -0400] "GET webpage.html HTTP/1.1" 400 236 - -

Я не спрашиваю, как анализировать файл, мне просто интересно, что произойдет, если формат не закончен?Сбой браузера пользователя?Отключение электричества?ЭСТ.

Кроме того, при разборе файла я заметил, что в одном конкретном случае индекса [8] (который должен быть 200 300 400 500 кодов) была ошибка, где индекс [8] будет 1,1 "..

Есть идеи?

1 Ответ

0 голосов
/ 13 марта 2012

'-' просто указывает на то, что информация о поле недоступна (http://httpd.apache.org/docs/2.2/logs.html). Эти два последних дефиса просто означают, что какой-либо информации, которая должна быть зарегистрирована, не было там, когда было выпущено сообщение.

Вторая часть об индексе [8] состоит в том, что вы делаете предположения о том, как форматируется строка журнала. Могу поспорить, что вы разделяетесь на пробелы, и в начале есть пробел.

...