Запретить заголовок страницы robots.txt - PullRequest
1 голос
/ 21 января 2020

Я хочу запретить заголовок. php в robots.txt от индексации. URL файла:

https://example.com/header.php

Но я не уверен, что правильно:

Disallow: /header.php

или

Disallow: header.php

1 Ответ

0 голосов
/ 21 января 2020

URL-пути, указанные в robots.txt, всегда должны начинаться с sla sh (ie. root -относительно).

От Спецификация Google robots.txt :

Значение [путь], если оно указано, должно отображаться относительно root веб-сайта, для которого был выбран файл robots.txt (с использованием того же протокола, номера порта, хост и доменные имена). Значение пути должно начинаться с "/" для обозначения root. Путь чувствителен к регистру.

Итак, вы должны написать:

Disallow: /header.php

Однако это предотвращает сканирование , не обязательно предотвращает индексирование , если этот URL-адрес связан с. Хотя я подозреваю, что это всего лишь HTML -фрагмент (?), Поэтому в этой ситуации нужно было бы блокировать сканирование. (Но учтите, что если у вас много , включая , тогда они лучше содержатся в подкаталоге и просто блокируют подкаталог.)

Проверьте файл robots.txt в robots.txt от Google тестер перед выходом в эфир.

...