как сохранить метаданные PDF в AzureBlob - PullRequest
1 голос
/ 27 июня 2019

как сохранить метаданные исходного PDF при загрузке файла в BLOB

Я сохраняю файл в Blob, используя openOutPutStream, и, читая его, анализирую содержимое, используя Tika, который возвращает мне метаданные файла в ответ

Inputstream is = newBlobReference.openInputStream();    
BodyContentHandler handler = new BodyContentHandler(-1);
            Metadata metaData = new Metadata();
            ParseContext context = new ParseContext();
            PDFParser parser = new PDFParser();
            String content = "";
            parser.parse(is, handler, metaData, context);

только для того, чтобы получить несколько метаданных (Creation-Date / xmpTPg: NPages) pdf. Мне нужно проанализировать файл с помощью Tika.Есть ли способ сохранить метаданные в BLOB при загрузке PDF

1 Ответ

0 голосов
/ 27 июня 2019

К сожалению, невозможно получить данные во время процесса загрузки из хранилища BLOB-объектов Azure. Метаданные могут быть установлены и извлечены, когда большой двоичный объект был создан / создан в хранилище BLOB-объектов Azure, подробнее об этом можно узнать в этой документации , также есть другие альтернативы, такие как Azure indexer , который также требует, чтобы большие двоичные объекты находились в хранилище. Я бы рекомендовал использовать метод, который вы используете, а затем добавить эту информацию в отдельный большой двоичный объект, в котором будут храниться эти метаданные.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...