Повторяющиеся записи в индексе Apache Solr после переиндексации в Drupal - PullRequest
1 голос
/ 01 июня 2011

Я использую интеграцию поиска Apache Solr на своем веб-сайте Drupal 6: govoluntourism.com .У меня есть результаты поиска, тематические с использованием представлений и файла search-result.tpl.php.

В search-result.tpl.php содержится:

$nid = $result['fields']['nid']['value'];
echo views_embed_view($name = 'search', $display_id = 'default', $nid);

Когда я добавляю контент в свойСоздайте сайт и запустите cron. Похоже, что в индексе apache делаются повторяющиеся записи, потому что я получаю дубликаты в результатах поиска только контента, который был ранее проиндексирован.

Это проблема на стороне сервера илиошибка в моей конфигурации?Не уверен, куда идти отсюда.спасибо.

сайт: govoluntourism.com

Ответы [ 2 ]

3 голосов
/ 02 июня 2011

Я посмотрел ваш сайт, и все результаты поиска дубликатов указывают на одни и те же узлы, так что это означает, что у вас, вероятно, нет фактического дублированного содержимого.

Первое, что нужно сделать, если вы подозреваете, что ваш индекс -поврежден, и вы не можете найти проблему, вероятно, переиндексировать весь ваш контент.Вы можете сделать это, зайдя сюда: http://govoluntourism.com/admin/settings/apachesolr/index.

Далее вы можете выбрать «Удалить индекс», затем «Переиндексировать весь контент».Что это будет делать, это перестроить весь ваш индекс с нуля.Обратите внимание, что если вы выберете «Переиндексировать все содержимое», это произойдет немедленно.Если у вас запущен cron, cron будет медленно перестраивать индекс, который будет использовать меньше ресурсов, но займет гораздо больше времени.

Как только вы это сделаете, у вас будет лучшее представление о том, что происходит.

Если это не сработает, возможно, у вас проблема с настройкой темы результатов поиска.

1 голос
/ 01 июня 2011

Вы пытались запросить Solr напрямую? Если у вас есть дубликат, проблема заключается в том, что вы импортируете дубликат контента.

...