Robots.txt, чтобы запретить все и разрешить только определенные части сайта / страниц. Поддерживается ли «allow» сканерами, такими как Ultraseek и FAST? - PullRequest
4 голосов
/ 26 декабря 2008

Просто хотел узнать, можно ли запретить весь сайт для сканеров и разрешить только определенные веб-страницы или разделы? Поддерживается ли «allow» сканерами, такими как FAST и Ultraseek?

1 Ответ

7 голосов
/ 26 декабря 2008

Существует директива Allow , однако нет никакой гарантии, что конкретный бот ее поддержит (так же, как нет гарантии, что бот даже проверит ваш robots.txt для начала). Вероятно, вы можете узнать из своих блогов, действительно ли определенные боты индексируют только те части вашего сайта, которые вы разрешаете.

Формат, позволяющий использовать только определенную страницу или раздел вашего веб-сайта, может выглядеть следующим образом:

Allow: /public/section1/
Disallow: /

Это (должно) предотвращать сканирование и индексацию ботами всего, кроме содержимого в / public / section1

...