SOLR Tika: добавить текст файла в существующую запись (ExtractingRequestHandler) - PullRequest
1 голос
/ 28 июля 2010

Я индексирую сообщения в SOLR с полями "name", "title" и "description". Позже я хотел бы добавить файл (например, документ Word или PDF), используя Tika / ExtractingRequestHandler.

Я знаю, что могу добавлять документы вот так: (или через другие интерфейсы)

локон «http://localhost:8983/solr/update/extract?literal.id=post1&commit=true' -F "myfile=@tutorial.html"

Но это заменяет правильный пост (пост1 выше) - есть ли параметр, который я могу передать, чтобы он только добавил к записи?

1 Ответ

6 голосов
/ 28 июля 2010

В Solr (версия <4.0) вы не можете изменять поля в документе. Вы можете только удалить или добавить / заменить целые документы. Следовательно, при «добавлении» файла в документ Solr вам необходимо перестроить документ по его текущим значениям (используя <code>literal), то есть запросить документ, а затем:

http://localhost:8983/solr/update/extract?literal.id=post1&literal.name=myName&literal.title=myTitle&literal.description=myDescription&commit=true
...