Как повысить оценку в лазурном поиске неструктурированных данных BLOB-объектов? - PullRequest
0 голосов
/ 06 декабря 2018

Я использую поиск Azure, который использует индексирование по умолчанию для данных, которые импортируют неструктурированные данные (pdf, doc, текст, файлы изображений и т. Д.)

Я не создал профиль оценки по умолчаниюдоступные поля.

Почти все настройки на портале являются настройками по умолчанию.Если я ищу какой-либо текст через поисковик, то получаю JSON-результат с очень низкой оценкой.

Я читал об увеличении счета с помощью профиля оценки.однако условия, которые я хочу узнать, могут быть в любом документе в любом месте.так как я могу решить, на каком поле я могу весить больше?

как я могу создать больше пользовательских полей для этих входных файлов?Нужно ли писать анализатор документов?

Я использую SDK 4.0 и c # в своем боте.

, пожалуйста, предложите.

1 Ответ

0 голосов
/ 11 декабря 2018

Чтобы использовать профиль оценки, поля, которые вы пытаетесь увеличить, должны быть частью определения индекса, иначе механизм оценки не будет знать о них.

Вы упомянули использование неструктурированных данных в качестве источника, я предполагаю, что это означает, что ваши данные не имеют какой-либо стабильной или предсказуемой структуры.Если это так, то вы, вероятно, не сможете обновить определение индекса, чтобы оно точно соответствовало структуре каждого документа, поскольку разные документы, вероятно, будут иметь разную и непредсказуемую структуру.Если вы знаете, какие поля вы хотите увеличить, и знаете, как извлечь эти поля из документа, то вы можете обновить определение индекса только теми полями, которые вам нужны, а затем использовать API документа «слияние» для заполнения этого поля.за каждый документ.

https://docs.microsoft.com/en-us/rest/api/searchservice/addupdate-or-delete-documents

Для этого потребуется извлечь все документы из индекса, проанализировать данные, чтобы извлечь поле, которое вы хотите увеличить, и затем использовать API слияния для обновления данных индексас данными, которые вы извлекли.Получив это, вы сможете использовать это поле как часть профиля оценки.

...