Мой вопрос является просто продолжением этой операции, где я хотел бы отобразить страницу № для искомого слова во входном документе.
Solr открыть документ после поиска по ключевому слову
Поэтому я использую
1) tika-0.9.jar , чтобы извлечь вывод в виде промежуточного файла.
2) Затем я создаю другой XML-файл, в котором извлеченные выходные данные являются входными данными, и записываю данные в формате, ожидаемом Solr, а затем публикую этот xml с помощью команды post.jar .
3) Я использую Solritas Serach UI с Solr 3.2 версия (http://localhost:8983/solr/browse) для просмотра результатов.
Я хотел бы отобразить номер страницы вместе с результатами.
Пример:
Если я найду проверку слова во входных PDF-файлах, то, что я управлял до сих пордолжен отобразить весь набор документов, которые содержат этот результат, и по щелчку любого документа откроется входной PDF.Я хотел бы отобразить страницу № , где есть слово «test» в каждомиз входного документа.
Пожалуйста, дайте мне несколько советов, например, можно ли это сделать каким-либо образом, как сохранить номер страницы в индексе.
Ваши предложения приветствуются.
Спасибо и всего наилучшего.