У меня есть большое количество документов, word / excel / pdf и c, которые хранятся в нескольких windows общих файловых ресурсах, не уверен в общем размере, но будет не менее нескольких ТБ файлов. Мне нужен интерфейс для поиска этих документов (в том числе их содержимого) и предварительного просмотра / загрузки документов, соответствующих запросу. Также важно, чтобы ACL соблюдались, возвращая результаты поиска только тех файлов, к которым имеет доступ зарегистрированный пользователь.
Первоначальная идея заключалась в том, чтобы использовать такой инструмент, как Apache Tika, для получения содержимого файла / метаданных и свалить все это в elasti c или что-то подобное. Самой большой проблемой этой идеи является соблюдение ACL и фильтрация результатов поиска.
Существует ли очевидное решение Office365 / Azure для этого? Я новичок ie с Azure, и это немного минное поле, но я видел, что могу использовать локальный шлюз для подключения общих файловых ресурсов к мощным приложениям и другим azure инструментам. Надеюсь, что есть доступная функциональность, которая позволит мне создать интерфейс для поиска по этим общим папкам и т. Д. c.