Неопубликованные элементы, отображаемые в результатах поиска Drupal (приложение для поиска Google) - PullRequest
2 голосов
/ 23 октября 2009

Я недавно унаследовал сайт Drupal 5 и хочу сделать ряд улучшений. Некоторые из них вращаются вокруг результатов поиска.

  1. Неопубликованные страницы отображаются в результаты поиска. Что-нибудь из этого старые страницы, другие недавно неопубликованной. Все правильно помечены как неопубликованные в CMS и все еще появляются

  2. Устаревшие страницы отображаются из поисковой системы. Структура пути URL изменена, и эти элементы являются старыми результатами в БД.

Из того, что я могу сказать, сайт использует Google Search Appliance (GSA) для поиска, а не поиск по умолчанию в Drupal. Можно ли быть уверенным, что он использует GSA, а не видит, что модуль включен?

Если это GSA, похоже, я мог бы получить кого-то, имеющего доступ к GSA, чтобы перестроить результаты поиска на сайте. Это правильно?

Если перестроение результатов поиска является правильным способом, похоже, всякий раз, когда из сайта удаляется достаточное количество контента, мне нужно будет найти кого-нибудь, чтобы перестроить поиск. Есть ли лучший / автоматический способ?

Ответы [ 4 ]

1 голос
/ 24 ноября 2009

GSA может по-прежнему отображать удаленный контент в зависимости от того, какой у вас источник данных.

Если контент поступает из канала базы данных, а затем удаляется из запроса, он будет отброшен. Если содержимое поступало в результате естественного сканирования или через пользовательский фид коннектора, оно не будет удалено из индекса при удалении. Вместо этого ему необходимо выполнить цикл из индекса, что может занять некоторое время.

Один из способов заблокировать отображение удаленных URL-адресов - это сделать это через интерфейс. В интерфейсе администратора GSA перейдите в раздел Обслуживание> Внешние интерфейсы, затем выберите свой внешний интерфейс и нажмите вкладку Удалить URL. Вы можете перечислить свои URL-адреса или заблокировать группу URL-адресов с помощью регулярных выражений.

1 голос
/ 24 октября 2009

Похоже, это друпал, который занимается поиском. Google должен был бы получить доступ к базе данных, чтобы показать неопубликованные узлы. Возможно, вы используете представления для поиска, но забыли взять только опубликованные узлы.

Если Drupal обрабатывает поиск, вам просто нужно очистить и перестроить поисковый индекс. Это можно сделать без особых проблем, если у вас не слишком много контента.

0 голосов
/ 29 октября 2009

Чтобы поддерживать Google Appliance в актуальном состоянии, вы можете попробовать XmlSiteMap - модуль, который публикует правильную карту сайта XML для всего вашего контента.

Для интернет-сайта публикация карты сайта - это хороший способ поддерживать поисковые системы в актуальном состоянии, поскольку они могут использовать ее для получения информации о новых страницах и очистки старых страниц. Я предполагаю, что Google Appliance будет использовать это тоже.

0 голосов
/ 24 октября 2009

Я отправил ответ на ваш более общий вопрос о доступе к узлу . Проблема с результатами поиска может быть связана с этим.

...