Azure Cognitive Search: получение всего документа в результате поиска из azure хранилища BLOB-объектов - PullRequest
0 голосов
/ 05 марта 2020

Я использую azure хранилище BLOB-объектов для хранения своих документов. Когда я ищу определенный topi c, присутствующий в документе, я получаю весь документ (.pdf) в качестве результата поиска.

Теперь мое требование:

  1. Откройте PDF-файл, в котором найдено совпадение.
  2. Go с указанным c номером страницы, для которого выполняется поиск
  3. Выделите сопоставленный текст.

Чтобы сделать такую ​​вещь, нужны ли какие-либо особые умения, которые следует добавить в набор умений.

1 Ответ

0 голосов
/ 09 марта 2020

В Azure навыках поиска силы , есть специальный навык, который поможет с этим: генератор hOCR на https://github.com/Azure-Samples/azure-search-power-skills/blob/master/Vision/HocrGenerator/README.md. Формат hOCR - это то, что позволяет нам подсвечивать документы в демоверсии JFK .

...