PHP CURL вызывает огромный доступ к Apache - PullRequest
0 голосов
/ 03 декабря 2010

Мне любопытно узнать, как запретить Apache регистрировать каждый URL, который я ищу с помощью CURL.

Мой PHP-скрипт открывает несколько сотен тысяч URL-адресов, сканирует их, берет крошечную информацию, закрывает,и затем открывает следующее.

Я обнаружил после открытия журнала доступа, что каждый URL, открытый с помощью CURL, записывается в журнал доступа.

::1 - - [01/Dec/2010:18:37:37 -0600] "GET /test.php HTTP/1.1" 200 8469 "-"..."

Мой журнал доступа почти 45 МБ велик,Кому-нибудь помочь?

Ответы [ 3 ]

3 голосов
/ 03 декабря 2010

Для журнала доступа - запись любого входящего трафика

Чтобы эффективно управлять веб-сервером, необходимо получать отзывы об активности и производительности сервера, а также о любых проблемах, которые могут возникнуть. HTTP-сервер Apache предоставляет очень широкие и гибкие возможности ведения журналов. Этот документ описывает, как настроить его возможности ведения журнала и как понять, что содержат журналы.

источник: http://httpd.apache.org/docs/trunk/logs.html

Конечно, у вас есть возможность отключить ведение журнала (желательно нет)

0 голосов
/ 03 декабря 2010

Если все ваши запросы скручивания поступают из одной или иным образом управляемой группы IP-адресов, вы можете исключить их из журналов с помощью конфигурации, подобной следующей:

# Set your address here, you can do this for multiple addresses
SetEnvIf Remote_Addr "1\.1\.1\.1" mycurlrequest
CustomLog logs/access_log common env=!mycurlrequest

Вы можете сделать что-то подобное споле агента пользователя, которое по умолчанию будет указывать, что оно скручивается.

Вы можете прочитать больше здесь: http://httpd.apache.org/docs/2.2/logs.html#accesslog (условное ведение журнала является последним разделом этого заголовка) и здесь http://httpd.apache.org/docs/2.2/mod/mod_setenvif.html#setenvif

Если вы хотите условно исключить ведение журналаЯ бы к нему самым точным способом, таким как IP-адрес.В случае, если сервер доступен извне, вы, вероятно, не захотите регистрировать внешние запросы от curl.

Используя условное ведение журнала, вы также можете сегментировать свое ведение журнала, если вы хотите создать несколько файлов, один из которых вы могли быкатиться чаще.Преимущество этого состоит в том, что вы можете сэкономить место и в то же время иметь данные журналов, чтобы помочь в исследовании и отладке.

0 голосов
/ 03 декабря 2010

См. Руководство Apache , о Условные журналы . Это может быть то, что вы ищете.

...