Solr частичное обновление индекса документа - PullRequest
3 голосов
/ 07 марта 2011

Я использую плагин Solr и Solr: Cell для индексации и поиска в форматированных текстовых документах и ​​метаданных.

ОПРЕДЕЛЕНИЕ: solr_document = tuple (rich_text_document, метаданные1, метаданные2)

Я хочу переиндексировать некоторые solr_documents при изменении метаданных, но только части в solr_document, которые изменились, а не весь solr_documnt, потому что синтаксический анализ и извлечение текста из документов форматированного текста требуют больших затрат и смысла, поскольку документ форматированного текста не был изменен .

Поддерживает ли Solr частичное обновление индексов документов?

Доп:
Я использую Solr через sunspot в приложении Rails. Один из главных разработчиков солнечных пятен говорит здесь что:

Solr не поддерживает концепцию частичные обновления - на самом деле, обновление документа на самом деле состоит из удаления его из индекса и последующего добавления. Так, Sunspot должен создавать полный документ каждый раз, когда что-нибудь изменения; это неудачное ограничение с точки зрения производительности, но это очень важно для работы Solr и Lucene.

Есть ли что-нибудь, что можно сделать, может быть, Solr: Cell что-то позволяет?

1 Ответ

3 голосов
/ 08 марта 2011

Поддерживает ли Solr частичное обновление индекса документа?

Нет. Ознакомьтесь с FAQ .

Есть что-нибудь, что можно сделать?

Да, IIRC в проекте JIRA возникла проблема по этому поводу. Посмотрите, спросите, чего не хватает, внесите свой вклад в его реализацию.

...