Получение zip и неархивированных файлов с ftp сайта через Azure Data Factory - разархивирование - PullRequest
0 голосов
/ 01 июня 2018

Я успешно получаю файлы с ftp-сайта через фабрику данных Azure и в процессе распаковываю их.Я устанавливаю исходный набор данных для ZipDeflate.Однако теперь у меня есть похожий конвейер, где я должен получать файлы с FTP-сайта, где есть смесь файлов .zip и других типов файлов, таких как .csv и .xls.

Когда я пытаюсь выполнить ZipDeflate для этого действия копирования, он хочет «дефлировать» все файлы (не только .zip).Я вроде ожидал этого.Я думаю, единственное, что нужно разархивировать только файлы .zip и НЕ разархивировать файлы .xls и .csv, это сделать их в отдельных операциях копирования (один для файлов, нуждающихся в разархивировании, и один для всех остальных) .... Этоправильно или есть другой способ сделать все это в одном упражнении?

Спасибо !!J

1 Ответ

0 голосов
/ 01 июня 2018

Ну да.Вам нужно иметь два действия копирования.Но в этом случае, я думаю, у вас будет два исходных набора данных с другим фильтром файлов.(один для .zip и второй для всех остальных) Мне пришло в голову использовать метаданные для получения имени файла.После этого в условии IF вы проверяете, содержит ли имя файла «.zip», вы переходите к операции для разархивирования, и если false, вы продолжаете работу без разархивирования.Таким образом, вы используете только один набор данных, который будет собирать все файлы, а не иметь отдельно.Надеюсь, что это может сработать и помочь вам.:)

https://docs.microsoft.com/en-us/azure/data-factory/control-flow-get-metadata-activity

...