Я пытаюсь проиндексировать некоторые документы PDF, а затем создать пользовательский интерфейс поиска.
Этот вопрос в некоторой степени связан с
Solr Индексировать PDF-документы и публиковать их на удаленном сервере.
1) Индексирование документов PDF -> Я использую tika jar для преобразования PDF в текстовые файлы, а затем использую команду curl для их индексации.
2) Интерфейс поиска -> I mиспользуя Solritas функцию просмотра и встроенный пользовательский интерфейс.
Цель:
При поиске слова произнесите «Lucene» в спискепроиндексированные документы, и когда я получаю набор результатов для данного запроса, я хочу, чтобы ссылка отображалась для каждого возвращенного документа, и при щелчке по любому документу, который я мог бы открыть для этого документа.
Мой текущиймысли:
Я думаю, что мне, возможно, придется изменить первый шаг с двухстороннего шага на отдельный шаг их прямого индексирования.Я даже думаю, что в schema.xml должно быть дополнительное поле, в котором говорится о расположении этих PDF-документов.
Пожалуйста, сообщите мне некоторые предложения