Используемая версия Solr - 7.6.0 (Режим без схемы).Я попытался проиндексировать несколько документов PDF с помощью утилиты Post, предоставленной по умолчанию.Теперь, когда я делаю запрос, детали файла, содержащего строку запроса, отображаются правильно.Но я не мог видеть ни одного поля с фактическим содержанием представленного файла.Мой обработчик запросов Solrconfig.xml выглядит следующим образом:
<requestHandler name="/update/extract" startup="lazy" class="solr.extraction.ExtractingRequestHandler" >
<lst name="defaults">
<str name="uprefix">ignored_</str>
<str name="fmap.a">ignored_</str>
<str name="fmap.div">ignored_</str>
<str name="fmap.content">text</str>
<str name="captureAttr">true</str>
<str name="lowernames">true</str>
<bool name="ignoreTikaException">true</bool>
</lst>
</requestHandler>
При публикации pdf-файлов для индексации автоматически созданный файл managed-schema.xml не содержал в себе никакого поля «Содержимое».Также при запросе отображаются только метаданные файла, такие как идентификатор, дата, заголовок, типы контента, размер потока, автор и т. Д., Но не выделяется фактическая информация о контенте.Просьба уточнить.«http://localhost:8983/solr/TestCore6/select?hl=on&q=mars&wt=json"