Внешняя таблица для формата данных Parquet или Avro выдает ошибку - PullRequest
0 голосов
/ 07 мая 2020

Я создал внешнюю таблицу для выборки данных Parquet из ADLS, которая вызывает ошибку ниже.

Query execution has resulted in error (0x80131500): Partial query failure: 0x80131500 (message: 'Input parquet file is ill-formed and cannot be processed: 'not a Parquet file (size too small)'.: ', details: 'Source: Kusto.Common.Svc [0]Kusto.Common.Svc.Exceptions.IngestionSourceParquetReaderException: Input parquet file is ill-formed and cannot be processed: 'not a Parquet file (size too small)'. Timestamp=2020-05-07T11:22:42.0340199Z

Структура папок в ADLS: - logs / {AppId} / 2020/05 / 07

Определение внешней таблицы:

.create external table ExTParquet (AppId:string,UserId:string,Email:string,RoleName:string,Operation:string,EntityId:string,EntityType:string,EntityName:string,TargetTitle:string,Params:string,EventProcessedUtcTime:datetime,PartitionId:string,EventEnqueuedUtcTime:datetime) 
kind=blob
partition by 
   AppId,
   bin(EventProcessedUtcTime,1d)
dataformat=parquet
( 
   h@'https://streamoutalds2.blob.core.windows.net/stream-api-raw-parquet/logs;secret_key'
)
with 
(
   folder = "ExternalTables"   
)

Примечание: если я указываю полный путь к файлу и удаляю разделение исходного каталога из определения внешней таблицы, это работает хорошо . Но мне нужно подготовить данные для всех файлов в каталоге, а не только для одного.

Любая помощь приветствуется.

1 Ответ

1 голос
/ 07 мая 2020

Это известная проблема, в стадии разработки. Вы можете открыть заявку в службу поддержки (Azure Data Explorer). Команда также опубликует здесь обновление, когда проблема будет решена.

[EDIT], проблема должна была быть решена.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...