как передать запрос в лазурный поиск от бота - PullRequest
0 голосов
/ 10 сентября 2018

Я разрабатываю чат-бота:

  1. с использованием платформы ботов Microsoft в node-js.
  2. с использованием BLOB-объекта Azure для хранения большого количества неструктурированных данных в форматах pdf, doc, exel и image.
  3. с помощью поиска Azure для поиска запрашиваемой информации в BLOB-объекте.

Теперь, чтобы сделать поиск более точным, как отправить введенный пользователем текст в поиск Azure через URL.

В документе говорится о Lucene и простом запросе. Но как конвертировать пользовательский ввод текста в такой синтаксис запроса. Мои сгустки абсолютно неструктурированы.

Нужна ли дополнительная обработка текста? прямо сейчас Azure возвращает результаты на основе полнотекстового поиска. Я не уверен, как это поиск.

Например: если я печатаю в боте: что такое Aconext? он отправляет мне все файлы, где находит термин Aconext . Он автоматически игнорирует слова «что» и «есть» автоматически?

Пожалуйста, помогите мне понять это. Спасибо.

1 Ответ

0 голосов
/ 10 сентября 2018

Я бы порекомендовал взглянуть на документацию о том, как полнотекстовый поиск работает в Azure Search .Он содержит подробную информацию о том, как именно работает поиск, и о различных операторах, которые вы можете использовать в своем поиске для получения конкретных результатов.В зависимости от того, что вы пытаетесь выполнить с помощью своего поискового бота, вам может потребоваться или не потребоваться дополнительная обработка текста, но приведенная выше документация должна дать вам хорошее представление о том, какие варианты доступны для вас.

Чтобы ответить на ваш конкретный вопросвопрос, если вы просто делаете общий поиск, передавая "что такое Aconext?"в поле «поиск» он будет обрабатывать пробелы между словами как оператор ИЛИ, что означает, что вы получите результаты, содержащие «что такое« ИЛИ »означает« ИЛИ »Aconext?».Однако вы, скорее всего, в основном видите документы, содержащие «Aconext», потому что эти документы имеют более высокий показатель релевантности, поскольку «Aconext» является более редким термином, чем «что» или «есть».

...