В каком формате запрошенные URL записываются в файлы журнала веб-сервера? - PullRequest
0 голосов
/ 06 сентября 2011

Я занимаюсь разработкой бесплатного приложения для сайта.

Я хотел бы спросить, в каком формате запрашиваются URL-адреса, записанные в файлах журналов веб-сервера?

Я хочу проанализировать эти файлы журналов, чтобы извлечь различные страницы веб-сайта.

Всегда ли формат "GET /mywebpage.html" в каждой строке? Спасибо!

Ответы [ 2 ]

0 голосов
/ 25 ноября 2011

На сегодняшний день наиболее распространенным форматом является Apache CLF (общий формат журнала или комбинированный формат журнала):

LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-agent}i\"" combined

Чтобы получить лучший ответ, необходимо указать используемый веб-сервер.или, по крайней мере, покажите примерную строку журнала.

0 голосов
/ 06 сентября 2011

Это не всегда одно и то же - значение по умолчанию зависит от сервера, и его можно настраивать.Например, в Apache вы можете установить директиву CustomLog в вашей конфигурации, что позволит полностью настроить информацию, которая регистрируется, порядок ее регистрации и файл, в который она регистрируется.*

...