Searchengine ботов и мета-обновление для отключенного JavaScript - PullRequest
4 голосов
/ 20 апреля 2010

У меня есть веб-сайт, на котором должен быть включен JavaScript, чтобы он мог работать

есть тег

Ответы [ 6 ]

3 голосов
/ 29 апреля 2010

Вместо того, чтобы принудительно отправлять пользователя / бота, почему бы просто не сделать так, чтобы текст отображался вверху страницы с указанием включить javascript для использования сайта?

Это позволит ботам по-прежнему читать страницу и переходить по ссылкам, не связанным с JavaScript. Это устранит проблемы с перенаправлением и не будет необходимости обслуживать ботов на другой странице. Что заставит вас обновить несколько страниц.

Возможно, вы также захотите взглянуть на инструменты Google для веб-мастеров , чтобы увидеть, что все Google в настоящее время читают и улучшают на этом основании.

Пример: отключение javascript в SO создает вверху красный баннер, который просто говорит: «Переполнение стека лучше всего работает при включенном JavaScript», вы можете сделать эту ссылку доступной для страницы с дополнительной информацией, если считаете, что этого недостаточно.

2 голосов
/ 29 апреля 2010

Вы пробовали <!--googleoff: all--> <noscript><meta redirect... /></noscript><!--googleon: all-->? Это не полное решение, но его стоит попробовать ...

1 голос
/ 29 апреля 2010

У вас может быть страница с надписью «Вам нужен JavaScript». А затем добавить на этой странице

<script>
window.location.href='/thejspage.html';
</script>

Таким образом, люди с поддержкой javascript будут легко отправлены на действительную страницу, и пауки просто останутся на этой странице, вместо того, чтобы сохранить страницу, где нет javascript.

Это также должно помочь вашему SEO (так как поисковые системы найдут страницу, которую могут видеть обычные пользователи).

1 голос
/ 29 апреля 2010

Поскольку не разрешено в страницы, а

1 голос
/ 22 апреля 2010

Вот что я хотел бы сделать:

  1. Сделайте так, чтобы сайт несколько работал с javascript. если вы используете ajax повсеместно, убедитесь, что в ссылках указан URL-адрес, по которому вы будете использовать ajax. Это может заставить ваш сайт «работать» без javascript.
  2. Добавьте некоторые перенаправления .htaccess для ботов. перенаправить их в какое-то нормальное место, где они могут перейти по некоторым ссылкам и проиндексировать некоторые вещи

Ваш сайт, как он есть, вероятно, очень плохой с точки зрения возможности сканирования и SEO.

edit : хорошо, я вижу вашу проблему. Сканеры перенаправляются после просмотра содержимого внутри noscript.

как насчет этого решения:

если у вас есть только одна страница с noscript, вы можете добавить некоторые правила перезаписи в вашу конфигурацию apache, которые будут показывать другую версию страницы для ботов, и эта версия не будет иметь тег noscript. например:

RewriteCond %{HTTP_USER_AGENT} Googlebot [OR]
RewriteCond %{HTTP_USER_AGENT} msnbot [OR]
RewriteCond %{HTTP_USER_AGENT} Slurp
RewriteRule ^.*$ nometa.html [L]

Кроме того, какие технологии вы используете? Вы используете какие-либо серверные языки, вы даже используете Apache? я предполагал, что у вас есть apache + html, но нет языка на стороне сервера. Если у вас есть что-то, работающее на стороне сервера, тогда это проще.

0 голосов
/ 22 апреля 2010

Может быть, вы могли бы использовать браузер без головы и предоставить HTML-снимок страницы тем, у кого не включен javascript, включая сканеры.

http://code.google.com/web/ajaxcrawling/docs/getting-started.html

...