Solr показать страницу № PDF вместе с результатами - PullRequest
3 голосов
/ 18 августа 2011

Мой вопрос является просто продолжением этой операции, где я хотел бы отобразить страницу № для искомого слова во входном документе.

Solr открыть документ после поиска по ключевому слову

Поэтому я использую

1) tika-0.9.jar , чтобы извлечь вывод в виде промежуточного файла.

2) Затем я создаю другой XML-файл, в котором извлеченные выходные данные являются входными данными, и записываю данные в формате, ожидаемом Solr, а затем публикую этот xml с помощью команды post.jar .

3) Я использую Solritas Serach UI с Solr 3.2 версия (http://localhost:8983/solr/browse) для просмотра результатов.

Я хотел бы отобразить номер страницы вместе с результатами.

Пример:

Если я найду проверку слова во входных PDF-файлах, то, что я управлял до сих пордолжен отобразить весь набор документов, которые содержат этот результат, и по щелчку любого документа откроется входной PDF.Я хотел бы отобразить страницу № , где есть слово «test» в каждомиз входного документа.

Пожалуйста, дайте мне несколько советов, например, можно ли это сделать каким-либо образом, как сохранить номер страницы в индексе.

Ваши предложения приветствуются.

Спасибо и всего наилучшего.

...