Чтение метаданных файлов в хранилище озера данных Azure - PullRequest
0 голосов
/ 03 мая 2018

Требуется прочитать метаданные файлов, хранящихся в хранилище озера данных Azure.

Файл может иметь формат JPEG, EXCEL или TIFF

Пожалуйста, посоветуйте, действительно ищите предложения. Я использую Microsoft Azure Data Lake Store и использую USQL.

1 Ответ

0 голосов
/ 03 мая 2018

На данный момент это не поддерживается. Похоже, что в отставании по сайту обратной связи

Вы можете написать собственный экстрактор, как указано в ссылке:

Если он доступен, например, EXIF ​​в JPEG, извлеките некоторые свойства из содержимого с помощью пользовательского экстрактора.

Согласно этому блогу они сделали это для извлечения свойств изображения, см. репо . Это может быть руководство о том, как реализовать это для вашего сценария. Вот пример запроса

@image_features =
    EXTRACT copyright string, 
            equipment_make string,
            equipment_model string,
            description string,
            thumbnail byte[], 
            name string, format string
    FROM @"/Samples/Data/Images/{name}.{format}"

    USING new Images.ImageFeatureExtractor(scaleWidth: 500, scaleHeight: 300);

@image_features = SELECT * FROM @image_features
                  WHERE format IN("JPEG", "jpeg", "jpg", "JPG");

OUTPUT @image_features
TO @"/output/images/image_features.csv"
USING Outputters.Csv();

Или попросите другой процесс извлечь эти свойства и поместить их в некоторый файл метаданных в Azure Data Lake, чтобы вы могли присоединиться к этому файлу.

...