Можно ли искать полнотекстовые файлы PDF с помощью Azure Search? - PullRequest
0 голосов
/ 07 декабря 2018

Я новичок в Microsoft Cognitive Services.Я пытаюсь создать поискового бота, который просматривает 2 файла PDF, которые хранятся как BLOB в хранилище Azure.Если пользователь задаст вопрос типа «Как я могу сделать флексреквест?», Он посмотрит файлы PDF и ответит пользователю.Проблема в том, что оба файла содержат ключевые слова 'flexrequest'.

Мне нравится знать, как я могу просмотреть pdf с помощью поиска Azure по ключевому слову.Я уже следовал учебнику по документации, но безуспешно.Он только ищет заголовок документа и возвращает ВЕСЬ документ.Мне нужна только определенная часть текста.

Есть предложения?

1 Ответ

0 голосов
/ 07 декабря 2018

Должна быть возможность запросить тело документа и вернуть фрагмент текста.Однако вам необходимо убедиться, что поле тела документа доступно для поиска и извлечения.

Как только ваш индекс настроен правильно, вы можете выполнять запросы по всем доступным для поиска полям в одном и том же индексе.Я не уверен, как выглядит ваш фактический индекс, но на основе вашего описания я создал нижеприведенный пример, в котором следует запросить термин в заголовке и документе и вернуть фрагменты документа, содержащие термин в ответе выделения.GET / indexes / yourIndexHere / docs? Search = flexrequest & searchFields = document, title & highlight = document & api-version = 2017-11-11

Я также предлагаю вам взглянуть на QnA Maker, который (также использует поиск Azure) и предназначен для поддержки именно таких сценариев.https://azure.microsoft.com/en-us/services/cognitive-services/qna-maker/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...