Azure Фабрика данных объединяет паркетные файлы по папкам - PullRequest
0 голосов
/ 16 июня 2020

У меня есть учетная запись ADLS Gen2 (включена HNS) с паркетными файлами в этом формате:

-MainFolder
 -SubFolder 1
 -SubFolder 2
   -Year
   -Month
   -Day
     -Parquet file 01
     -Parquet file 02
     -...

Я хочу использовать Azure Фабрику данных для объединения паркетных файлов самого нижнего уровня в один файл , окончательная структура должна выглядеть так.

-MainFolder
 -SubFolder 1
 -SubFolder 2
   -Year
   -Month
   -Day
     -Merged Parquet File

Если я использую «Копировать данные», я могу выбирать только между «Объединить файлы» и «Сохранить Hirach ie». Есть ли способ сделать это? Спасибо за помощь!

1 Ответ

0 голосов
/ 16 июня 2020

Если объединение файлов не работает для вас в операции копирования, вы можете использовать поток данных, а преобразование Union может объединить несколько файлов в один выходной файл.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...