Строка Disallow
- это все, что нужно. Он заблокирует доступ ко всему, что начинается с "/dir/mypage.html".
Линия Allow
лишняя. Значение по умолчанию для robots.txt - Allow: /
. В общем, Allow
не требуется. Это так, что вы можете отменить доступ к тому, что будет запрещено. Например, допустим, вы хотите запретить доступ к каталогу «/ images», за исключением изображений в подкаталоге «public». Вы бы написали:
Allow: /images/public
Disallow: /images
Обратите внимание, что порядок важен здесь. Сканеры должны использовать алгоритм «первого совпадения». Если вы сначала написали «Disallow», то сканер предположил бы, что доступ к «/ images / public» был заблокирован.