Могут ли поисковые системы индексировать веб-страницы, созданные с помощью JavaScript? - PullRequest
18 голосов
/ 05 мая 2009

Могут ли поисковые системы, такие как Google index, создавать сгенерированные JavaScript веб-страницы? Если щелкнуть правой кнопкой мыши и выбрать источник просмотра на странице, созданной с помощью JavaScript (например, с использованием GWT), вы не увидите динамически сгенерированный HTML-код. Я полагаю, что если поисковая система также не может увидеть сгенерированный HTML, то индексировать не так уж и много, верно?

Ответы [ 8 ]

13 голосов
/ 06 мая 2009

Ваше подозрение верное - на контент, созданный JS, нельзя положиться, чтобы он был виден поисковым роботам. Его также никто не может увидеть с отключенным JS - и в последний раз я добавил несколько тестов на сайт, над которым я работал (это был большой сайт с широкой аудиторией, с сотнями тысяч уникальных посетителей в месяц) около 10% пользователей не запускали Javascript ни в какой форме. Сюда входят поисковые роботы, браузеры ПК с отключенным JS, многие мобильные телефоны, слепые люди, использующие программы чтения с экрана ... и т. Д. И т. Д.

Вот почему контент, сгенерированный с помощью JS (без опции отката), является действительно плохой идеей.

Вернуться к основам. Во-первых, создайте свой сайт, используя bare-bones (X) HTML , по принципам REST (по крайней мере, в той степени, в которой требуется POST-запрос на изменение состояния). Простая семантическая разметка, и забудьте о CSS и Javascript.

Первый шаг - сделать это правильно, и весь ваш сайт (или столько, сколько имеет смысл) будет работать таким образом для поисковых ботов и Lynx-подобных пользовательских агентов.

Затем добавьте визуальный слой : CSS / graphics / media для визуальной полировки, но не измените существенно исходную (X) разметку HTML; позволяют оригинальному текстовому сайту оставаться нетронутым и функционировать. Держите разметку в чистоте!

Третье - добавить поведенческий слой : Javascript (Ajax). Предлагайте вещи, которые делают работу быстрее, плавнее, приятнее для пользователей / браузеров с поддержкой Ajax JS ... но только для тех пользователей. Пользователи без Javascript по-прежнему приветствуются; как и поисковые роботы, слабовидящие, многие мобильные телефоны и т. д.

Это называется прогрессивное улучшение в кругах веб-дизайна. Сделайте это так, и ваш сайт будет работать в любой разумной форме для всех.

7 голосов
/ 05 мая 2009

если поисковая система также не может увидеть сгенерированный HTML, то индексировать не так много

Это примерно так. Технически ничто не мешает поисковой системе реализовать движок javascript для своего бота / паука, но это обычно не делается. Они могли бы, но не будут.

С другой стороны, вы можете прослушать пользовательский агент поисковой системы и предоставить ему что-нибудь читабельное. Но поисковым системам это обычно не нравится, и они будут наказаны довольно сурово, если обнаружат различия в том, что вы отправляете в обычный браузер.

6 голосов
/ 05 мая 2009

Хорошее практическое правило: если вы видите его в Lynx , оно может быть проиндексировано Google.

Lynx - отличный тест, потому что он также дает вам представление о том, как программы чтения с экрана для слепых также увидят вашу страницу.

4 голосов
/ 04 июля 2016

Да, Google (и, скорее всего, Bing) будет индексировать динамически генерируемый HTML. Подробности здесь: http://searchengineland.com/tested-googlebot-crawls-javascript-heres-learned-220157.

2 голосов
/ 13 мая 2009

Есть несколько способов справиться с этим в GWT, , это - отличная дискуссия на эту тему. Похоже, что лучшим вариантом является подача статического контента SEO, когда пользовательский агент является ботом, при условии, что контент SEO идентичен контенту, который подается по маршруту GWT. Это может быть много работы, но если вы действительно хотите полностью богатое приложение GWT, оптимизированное для поисковых систем, оно может стоить.

2 голосов
/ 05 мая 2009

Google работает над выполнением простого Javascript для раскрытия некоторого контента, но они, конечно, не выполняют полные сценарии. Если вы беспокоитесь о SEO, вам следует рассмотреть возможность предоставления статических версий страниц.

1 голос
/ 05 марта 2011

Взгляните на одностраничный интерфейс Манифест о том, как приложение SPI (интенсивное AJAX) может быть проиндексировано Google и другими сканерами. Насколько это сложно, зависит от используемого веб-фреймворка.

0 голосов
/ 01 октября 2015

Даже если они выполняют основные JavaScript ИСПОЛЬЗУЕМЫЕ ВЕБ-САЙТЫ LIBRARIES И FRAMEWORKS, я не думаю, что такой бот, как бот Google или любой другой паук, также загрузит Js файлы, связанные с веб-страницей и без их загрузки код JS будет выдавать ошибки.

/*Correct Me If I am wrong*/
...