Я пытаюсь внедрить систему управления документами, используя Sharepoint.Одна из основных проблем заключается в том, что коллеги не могут найти документы в текущей настройке (локальный файловый сервер).Они попросили, чтобы у нас была система, которая сканирует загруженные документы и автоматически ищет в них ключевые слова, а затем заполняет столбец «Мета».
У меня был своего рода успех с OCR для файлов изображений, но получение ключевых слов из офисных документов (doc, xls и т. Д.) До сих пор не имело успеха.
Есть ли способ настроить поток, чтобы выполнить эту задачу для меня?
любая помощь сильно увязана.
я пробовал "Получить метаданные файла" и Azure "Текстанализ », но, похоже, он берет необработанные данные файлов (я полагаю, XML) и возвращает, что документ слишком большой для анализа.