Добавить "noindex" в ссылку на PDF - PullRequest
0 голосов
/ 10 мая 2018

У меня есть веб-сайт, где у меня есть ссылки на php script, где я генерирую PDF-файл с библиотекой mPdf , и он отображается в браузере или загружается в зависимости от конфигурации.

Проблема в том, что я не хочу, чтобы он был проиндексирован в google.Я уже поставил ссылку rel="nofollow", которая больше не индексируется, но как я могу dexindexe, что там уже есть?

с rel="noindex, nofollow" не работает.

Пришлось бысделать это только с помощью php или некоторого тега html

Ответы [ 2 ]

0 голосов
/ 10 мая 2018

Как Google должен деиндексировать что-то, если вы запретили его роботу доступ к ресурсу? ;) Поначалу это может показаться нелогичным.

Удалите ссылки rel="nofollow" для ссылок, а в сценарии, обслуживающем файлы PDF, добавьте заголовок X-Robots-Tag: none. Google сможет войти на ресурс и увидит, что этот конкретный ресурс запрещено индексировать, и удалит запись из индекса.

По завершении деиндексации добавьте правило Disallow в файл robots.txt, как упоминает @ mtr.web, чтобы роботы больше не истощали ваш сервер.

0 голосов
/ 10 мая 2018

Если у вас есть файл robots.txt , вы можете запретить Google индексировать какой-либо файл, добавив в него правило. В вашем случае это будет примерно так:

User-agent: *
disallow: /path/to/PdfIdontWantIndexed.pdf

Оттуда все, что вам нужно сделать, это убедиться, что вы отправили свой файл robots.txt в Google , и вскоре после этого он должен прекратить индексировать его.

Примечание:

Также может быть разумно удалить ваш URL из существующего индекса Google , потому что это будет быстрее в случае, если он уже был сканирован Google.

...