Коннектор содержимого общего ресурса в Azure для поиска - PullRequest
0 голосов
/ 14 января 2020

У меня есть большое количество документов, word / excel / pdf и c, которые хранятся в нескольких windows общих файловых ресурсах, не уверен в общем размере, но будет не менее нескольких ТБ файлов. Мне нужен интерфейс для поиска этих документов (в том числе их содержимого) и предварительного просмотра / загрузки документов, соответствующих запросу. Также важно, чтобы ACL соблюдались, возвращая результаты поиска только тех файлов, к которым имеет доступ зарегистрированный пользователь.

Первоначальная идея заключалась в том, чтобы использовать такой инструмент, как Apache Tika, для получения содержимого файла / метаданных и свалить все это в elasti c или что-то подобное. Самой большой проблемой этой идеи является соблюдение ACL и фильтрация результатов поиска.

Существует ли очевидное решение Office365 / Azure для этого? Я новичок ie с Azure, и это немного минное поле, но я видел, что могу использовать локальный шлюз для подключения общих файловых ресурсов к мощным приложениям и другим azure инструментам. Надеюсь, что есть доступная функциональность, которая позволит мне создать интерфейс для поиска по этим общим папкам и т. Д. c.

1 Ответ

0 голосов
/ 14 января 2020

Два отдельных вопроса здесь. Вы можете использовать Azure Search, который имеет индексаторы, способные извлекать и индексировать содержимое ваших файлов с 0 строками кода. Однако из-за большого объема данных биллинг не будет дешевым, и вам понадобятся несколько разделов, которые также увеличат стоимость.

Для аутентификации / авторизации вам потребуется внешний интерфейс чтобы отобразить результаты, чтобы вам было проще реализовать аутентификацию / авторизацию на нем и разрешить Azure Искать только часть запроса. Вы можете дать разрешение только на ваш интерфейс.

PS: Вы можете использовать Azure AD для аутентификации, но нет готовых функций для назначения информации, которую может видеть каждый пользователь. Вам нужно будет реализовать эту часть

...