Должны ли мы помещать папки с защитой паролем htaccess в файл robots.txt? - PullRequest
0 голосов
/ 24 августа 2011

Мы хотим запретить пользовательским агентам файлы JavaScript, CSS-файлы и картинки, верно? Классы, модули и другие папки такого типа должны быть защищены htaccess. Я прав? Если нет, пожалуйста, дайте мне знать об этом.

В результате типичный файл robots.txt (и мы не забываем защищать паролем другие папки) может содержать только несколько строк:

User-agent: *

Disallow: 

Disallow: /cssfiles/

Disallow: /jsfiles/

Disallow: /pics/

Имеет ли смысл запретить mysite.com?index.php&page=registration и mysite.com?index.php&page=login? Если да (зачем?), То как?

Кроме того, я что-то забыл?

1 Ответ

0 голосов
/ 24 августа 2011

Папки с базовым требованием HTTP-аутентификации, применяемым к файлу .htaccess, не обязательно должны быть в вашем файле robots.txt, поскольку пауки не смогут получить к ним доступ.

Я обычно не исключаю css / javascript при создании сайтов. Я не думаю, что основные поисковые системы заинтересованы в том, чтобы перечислять эти файлы в результатах поиска, потому что они бесполезны для большинства людей. Однако, если вы хотите быть в безопасности, добавление их не повредит.

Что касается изображений, если вы не хотите, чтобы они появлялись в таких местах, как Google Images, вы можете добавить папку с изображениями в файл robots.txt.

Я бы не стал запрещать вашу регистрацию или страницы входа. Они являются законными областями вашего сайта и должны быть проиндексированы.

Очень важно помнить о файлах robots.txt, что они не имеют возможности применять свои директивы. Они могут только дать рекомендации пауку, чтобы не ползти определенные вещи. В то время как большинство крупных поисковых систем будут уважать это, некоторые самодельные и / или вредоносные пауки не будут. Если есть что-то, что вы хотите защитить от пауков, убедитесь, что оно защищено каким-либо механизмом аутентификации или не доступно через Интернет.

...