Видимый текст Недоступен для поиска ботов? - PullRequest
1 голос
/ 22 июля 2011

Я хотел бы добавить в свой HTML некоторый текст, который не доступен или проиндексирован поисковыми роботами.

Возможно ли иметь видимый текст на сайте, который недоступен дляпоисковые боты?

Ответы [ 5 ]

5 голосов
/ 23 июля 2011

Да, есть несколько способов:

1. Запретить доступ с robots.txt (к каталогам, html-страницам)

User-agent: *
Disallow: /something.html

2. Добавьте метатег роботов на свою HTML-страницу:

<meta name="robots" content="noindex">

3. Используйте тег <noindex>. Обратите внимание, что это поддерживается не всеми поисковыми роботами;

<noindex>this may be seen by some of them</noindex>

4. Используйте JavaScript (чтобы скрыть только текст, а не всю страницу).

<script>document.write("Something");</script>
0 голосов
/ 30 апреля 2016

Обе пользователи технологии и Шарлемань упомянули несколько хороших ответов, но вот еще немного понимания того, как работают поисковые роботы:

Хорошие поисковые роботы будут следовать правилам и использовать мета-теги, без индексных тегов и т. Д. И уважать желания веб-мастера скрывать контент.

Авторы поисковых роботов-новичков могут писать своих ботов, просто сканируя страницу и не соблюдая ни одного из правил robots.txt. Профессиональные авторы ботов будут соблюдать правила robots.txt, которые выполняет мой поисковый бот.

Другой способ - добавить его за воротами входа в систему, поскольку поисковые роботы обычно не могут сканировать страницы, на которых пользователь должен войти, чтобы получить доступ к этому контенту. Из этого правила есть одно исключение. Даже при наличии входа в систему и если веб-сайт генерирует статические файлы .html, бот все равно может ползти за ограждением, чтобы увидеть контент. Использование статических .html страниц похоже на дыру в заборе. Страницы должны генерироваться динамически с помощью сценария (.php, .cgi, Node-файлы на стороне сервера .js и т. Д.), Когда обнаружен пользовательский файл cookie или переменная сеанса.

Причина, по которой поисковые роботы не выполняют JavaScript, заключается в том, что авторы роботов поисковых систем просто следуют за ссылками и текстом на странице, и они не хотят видеть код JS на своей странице результатов поиска. (Выдача). Поисковый бот выбирает каждую страницу в виде строки текста. Они видят все, что есть на той странице, которая извлекается. Затем бот анализирует страницу, чтобы извлечь содержимое страницы, но он не выполняет никакого кода, который находится на странице. Для автора поисковой системы нет никакой цели: eval() найденный код JavaScript, , но поисковый робот, безусловно, это видит! Автор просто хочет вставить текст в свою базу данных & ищите больше ссылок. Они не заинтересованы в выполнении какой-либо клиентской обработки для этого кода JS, просто чтобы «найти больше ссылок». Они уже могут видеть все ссылки на странице и даже извлекать их из тегов <script> в слое JS.

0 голосов
/ 23 июля 2011

Поисковые системы не выполняют javascript, поэтому вы можете ввести текст с помощью javascript.Что-то вроде этого?

<span id="text">
<span/>
<script>
    document.getElementById("text").appendChild( document.createTextNode("You can't search me!") );
</script>

Или вы можете сделать это во Flash, что является еще одной технологией, которую поисковые системы не включают в себя индексацию.

Если я ошибаюсь, надеюсь, другие экспертыпоправь меня:)

0 голосов
/ 23 июля 2011

Как упоминал Прашант, вы можете использовать файл robots.txt, чтобы полностью заблокировать доступ к определенным папкам или файлам, или добавить метатег на свои страницы, чтобы поисковые системы не индексировали его.Если вы просто хотите, чтобы определенный блок текста на вашей странице не индексируемый, вы можете отобразить его через AJAX / JavaScript, так как он не будет виден поисковым системам.

0 голосов
/ 23 июля 2011

Вы можете упомянуть об этом в своем файле robot.txt

Надеюсь, это поможет

http://www.ideaeng.com/tabId/98/itemId/161/5-ways-to-hide-content-from-your-search-engine-an.aspx

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...