Question

Из-за некоторых довольно странных архитектурных соображений мне пришлось настроить что-то, что действительно должно работать как консольное приложение как веб-страница.Он выполняет работу по написанию большого разнообразия текстовых файлов и XML-каналов из данных нашего сайта для различных других служб, поэтому очевидно, что для его запуска требуется немного времени, и он требует значительных ресурсов процессора.

Однако до этогоЯ развернул его, я довольно обеспокоен тем, что его могут неоднократно поражать пауки и тому подобное.Вполне нормально, что данные переписываются, но постоянные попадания на эту страницу будут вызывать проблемы с производительностью по очевидным причинам.

Стоит ли мне беспокоиться об этом?Или в действительности трафик паука вряд ли будет достаточно интенсивным, чтобы вызвать проблемы?

Alex K. · Answer 1 · 15 апреля 2010

Вы можете сказать большим, чтобы не паук вас; www.robotstxt.org .

Вы могли бы также реализовать некоторую форму критериев аутентификации / IP-адреса, которая помешала бы его работе.

RichieHindle · Answer 2 · 15 апреля 2010

Вы можете быть удивлены, сколько там пауков.

Вы должны использовать robots.txt, чтобы исключить их.

Если вы беспокоитесь, что пауки могут игнорировать robots.txt (а некоторые неизбежно будут), как насчет запроса POST, а не GET для запуска сценария? Это должно исключить всех пауков.

jemfinch · Answer 3 · 15 апреля 2010

Вы должны требовать аутентификацию для страницы.

Даже если вы исключите это из robots.txt, нет никаких гарантий, что пауки будут уважать это. Если это дорогая страница, которая может повлиять на доступность сайта, поместите ее за шлюзом аутентификации.

Беспокойство о пауках, постоянно попадающих на страницу с высоким спросом

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Беспокойство о пауках, постоянно попадающих на страницу с высоким спросом

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов