Существуют ли альтернативные места для файла robots.txt или конфигураций, которые его контролируют? - PullRequest
1 голос
/ 03 марта 2020

У нас есть веб-сайт с несколькими приложениями, настроенными в качестве дочерних сайтов. В настоящее время ни один из сайтов не индексируется Google должным образом. Я предполагаю, что это связано с файлом robots.txt, который содержит:

User-Agent: * Disallow: /

Я могу просмотреть файл robots.txt, добавив имя файла к URL-адресу root site (example.com/robots.txt), но при поиске в реальном каталоге веб-сервера файл robots.txt отсутствует. Я попытался поместить новый файл robots.txt в каталог root, но это не имеет никакого эффекта. Единственная вещь, которая возникла, когда я попытался найти эту проблему, - это функция IIS Search Engine Optimization, которую мы не установили. Существует ли какая-либо настройка сервера или политика, которая генерирует файл автоматически? У нас есть доступ к веб-серверу, но он был настроен и контролируется другим отделом.

VM server Windows Server 2012 R2 Standard IIS 8.5

1 Ответ

0 голосов
/ 10 марта 2020

Оказывается, наш веб-сайт направляется через прокси приложения Azure AD. В соответствии с этим do c роботы-гусеницы блокируются с помощью вышеупомянутого ответа по умолчанию robots.txt: https://docs.microsoft.com/en-us/azure/active-directory/manage-apps/application-proxy-security.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...