Как настроить Apache Tika с помощью Apache Solr 1.4.1 - PullRequest
5 голосов
/ 05 октября 2010

Я хочу проиндексировать большое количество PDF-документов.

Я нашел ссылку, показывающую, что это можно сделать с помощью Apache Tika, но, к сожалению, я не могу найти ссылку, которая описывает, как я могу настроить Apache Tika в Solr 1.4.1.

После настройки у меня все настроено, как я могу отправлять документы в Solr напрямую, без использования curl?

Я использую solrnet для индексации.

Ответы [ 2 ]

5 голосов
/ 05 октября 2010
3 голосов
/ 05 октября 2010

Поддержка ExtractingRequestHandler в SolrNet еще не завершена. Вы можете либо завершить его реализацию, либо обойти его и создать собственные HttpWebRequests.

...