Question

Я добавил PDF-документ в Solr

curl "http://localhost:8983/solr/update/extract?literal.id=doc2&captureAttr=true&defaultField=text&fmap.div=foo_t&capture=div"  -F "tutorial=@a.pdf"

и я бы хотел запросить слово «ошибки»

Я не получаю результатов.

Однако, если я запрашиваю его для слова «java», я получаю одну страницу (добавленный текст PDF), а в видимом тексте появляется слово «errors».

* * 1012 P.S. Я новичок в Lucene и Solr, и я не понимаю, почему не каждое слово в этом файле PDF доступно для поиска.

Luca Molteni · Answer 1 · 12 июля 2010

Посмотрите на этот похожий вопрос и ответ

Попробуйте использовать анализатор, чтобы увидеть, какие слова вставлены в индекс.

Как сделать запрос PDF в Solr?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.