использование фабрики данных Azure для распаковки нескольких файлов с http сайта - PullRequest
0 голосов
/ 28 ноября 2018

Я настроил источник данных «http-файл» в моем ADF для подключения к определенному URL-адресу (https://www.sos.wa.gov/_assets/corps/txtCorpsData.zip), который указывает на ZIP-файл, содержащий 4 отдельных файла .txt.

Служба успешно подключает и разархивирует файл, но читает только первый файл в ZIP-архиве. Как разделить источник на 4 отдельных источника? Я предполагаю, что есть какой-то параметр, который мне нужно использовать, но я не уверен, что этоможет быть.

Вот снимок экрана детали соединения: деталь соединения

1 Ответ

0 голосов
/ 29 ноября 2018

Мне кажется, я понял это, вроде: используя задачу «Копировать данные», которая указывает на «файл Http» в качестве источника.Этот источник «Http file» затем рассматривает URL из моего вопроса как связанную службу, источник также дефлирует ZIP.В задаче «Копировать данные» приемник является подключением BLOB-объекта.

Когда я запускаю эту задачу, он дефлирует ZIP-файл в новую папку под путем в подключении BLOB-объекта.Это представляет новую проблему, над которой я сейчас работаю, - это то, что создание новой папки, похоже, является тем, что GUID для конвейера работает, каким-то образом мне нужно найти способ указать имя папки, чтобы оно было согласованным..Я, скорее всего, опубликую еще один вопрос, задав этот вопрос позже.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...