Краулеры в гостях у моих cronjobs? - PullRequest
0 голосов
/ 26 февраля 2011

Я создаю веб-сайты уже несколько лет, в основном на php.На некоторых сайтах есть cronjobs, которые обычно запускаются раз в день.Файлы php, которые запускают cronjobs, хранятся на сервере вместе с файлами, которые доставляют страницы сайта.

Я знаю, что различные сканеры, законные и нет, посещают различные страницы моих сайтов.Теперь, если сканер посетит один из моих файлов cronjob, это активирует cronjob, иногда с нежелательными результатами.

Я уверен, что этого никогда не было, и, хотя я благодарен за это,Я пытаюсь понять почему.Конечно, нигде нет ссылок на мои URL-адреса cronjob, но я уверен, что различные сканеры посещали другие страницы, даже если на них никогда не было ссылок.

Что другие разработчики делают для решения этой проблемы?Поместить строку в файл robots.txt?Установить права доступа к php-файлам cronjob-relte?

Заранее спасибо.

Ответы [ 2 ]

9 голосов
/ 26 февраля 2011

Не храните скрипты cron в общедоступном каталоге.

0 голосов
/ 26 февраля 2011

Наряду с замечательным ответом @ Jeff:

Единственный способ, которым поисковая система будет сканировать вашу страницу, - это если есть ссылка на нее.Это может быть другая страница на вашем сайте, страница на чужом сайте или ваша собственная карта сайта.

Независимо от того, ваша работа cron никогда не должна быть напрямую доступна извне.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...