Способы отправки двоичных / структурированных документов в SOLR? - PullRequest
1 голос
/ 27 июля 2010

Я использую SOLR's ExtractingRequestHandler для загрузки текста документов.

Все примеры в документации используют curl для потоковой передачи документов, например:

curl 'http://.../extract?literal.id=doc1&commit=true' -F "myfile=@tutorial.html"

Это прекрасно работает, но есть следующее замечание:

использование "curl" или других инструментов командной строки для публикации документов в Solr хорошо для тестирования, но не рекомендуетсяметод обновления для лучшей производительности.

Раздел документации по отправке документов в SOLR является TODO.Какие есть альтернативные методы и чем они лучше?

1 Ответ

3 голосов
/ 27 июля 2010

Как правило, вы используете библиотеку на своем клиентском языке, которая поддерживает все коммуникации с Solr (например, для Java используется SolrJ, для PHP SolPHP (есть другие) и т. Д.).

Библиотеки предоставляют такие вещи, как простотаиспользование, обработка ошибок, правильная инкапсуляция и т. д.

...