Ограничение Azure результатов когнитивного поиска на основе условия - PullRequest
0 голосов
/ 27 мая 2020

Есть ли способ ограничить azure результаты когнитивного поиска на основе условия, например: if content.length < 500:

У меня проиндексировано несколько тысяч файлов pdf, и многие файлы совершенно бесполезны и содержат меньше содержимого. Я не хочу, чтобы эти файлы отображались в ответе на поиск.

Я не могу удалить их вручную, так как этих файлов много.

Любая помощь будет принята с благодарностью.

1 Ответ

0 голосов
/ 27 мая 2020

Если вы используете индексатор больших двоичных объектов для заполнения поискового индекса, вы можете добавить новое / дополнительное поле индекса и заполнить его значением metadata_storage_size. Убедитесь, что это поле "размер" настроено как фильтруемое, и вы сможете использовать это поле для фильтрации небольших PDF-файлов.

https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage#how - azure -cognitive-search-indexes -blobs

Если вы заполняете данные в своем поисковом индексе вручную, я думаю, вам все равно понадобится поле для хранения размера документа, и вам нужно будет заполнить его самостоятельно.

...