Лучшая практика полевого свертывания в SOLR 1.4 - PullRequest
5 голосов
/ 08 апреля 2010

Мне нужен способ свернуть дубликаты (определенные в виде строкового поля с идентификатором) результаты в Solr. Я знаю, что такая функция появится в следующей версии (1.5), но я не могу этого ждать. Каков наилучший способ удаления дубликатов с использованием текущей стабильной версии 1.4?

Учитывая, что поиск дубликатов в моем случае действительно прост (сравнение строкового поля), должен ли он быть фильтром, должен ли я перезаписать существующий SearchComponent или написать новый компонент, или использовать некоторые внешние библиотеки, такие как carrot2?

Общее количество результатов должно отражать сокращенный результат.

1 Ответ

6 голосов
/ 09 апреля 2010

Что ж, есть решение: просто примените исправление поля свертывания (последние новости об этой функции см. В http://issues.apache.org/jira/browse/SOLR-236, я также рекомендую http://blog.jteam.nl/author/martijn).

Сделав это, вы получитеработает с CollapseComponent. Обратите внимание, что с этой функцией связано снижение производительности поиска.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...