Как сделать запрос PDF в Solr? - PullRequest
1 голос
/ 12 июля 2010

Я добавил PDF-документ в Solr

curl "http://localhost:8983/solr/update/extract?literal.id=doc2&captureAttr=true&defaultField=text&fmap.div=foo_t&capture=div"  -F "tutorial=@a.pdf"

и я бы хотел запросить слово «ошибки»

http://localhost:8983/solr/select/?q=errors&version=2.2&start=0&rows=10&indent=on

Я не получаю результатов.

Однако, если я запрашиваю его для слова «java», я получаю одну страницу (добавленный текст PDF), а в видимом тексте появляется слово «errors».

* * 1012 P.S. Я новичок в Lucene и Solr, и я не понимаю, почему не каждое слово в этом файле PDF доступно для поиска.

1 Ответ

2 голосов
/ 12 июля 2010

Посмотрите на этот похожий вопрос и ответ

Попробуйте использовать анализатор, чтобы увидеть, какие слова вставлены в индекс.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...