SOLR / Lucene index возвращают уникальные результаты - PullRequest
1 голос
/ 14 сентября 2010

У меня есть индекс, который содержит несколько записей для одного и того же элемента, я указал: <uniqueKey>citation</uniqueKey> на основе цитирования, поле, которое я могу использовать для определения его уникальности в индексе.

Мне было интересно, есть ли какой-нибудь способ настроить запрос таким образом, чтобы он возвращал только уникальные результаты, основанные на этом поле.

или, скорее, чтобы удалить все дубликаты, но проблема сЯ столкнулся с тем, что я не храню текст, и единственный другой уникальный способ идентификации документов основан на двух полях, объединенных вместе.Я надеюсь, что есть способ сделать это без необходимости нового индекса.

спасибо

1 Ответ

2 голосов
/ 15 сентября 2010

Я думаю, что вам нужно Обрушение поля .Возможно, вы сможете выполнить это без переиндексации, но я считаю, что запросы занимают относительно много времени.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...