Какова связь между фабрикой данных Azure и движением данных Azure - PullRequest
0 голосов
/ 09 мая 2018

Мне нужна некоторая ясность в отношении фабрики данных и перемещения данных - обе фабрики данных (v1 и v2) доступны только в некоторых регионах, но перемещение данных доступно во многих регионах. Мне бы хотелось понять взаимосвязь между фабрикой данных Azure и движением данных Azure, поскольку они связаны с регионами Azure (https://azure.microsoft.com/en-gb/global-infrastructure/services/) и, если они связаны или совершенно разные продукты.

Например, если у меня есть фабрика данных в Северной Европе, будут ли все данные, обрабатываемые этой фабрикой данных, ВСЕГДА проходить через регион Северной Европы, даже если как источник, так и пункты назначения находятся, скажем, в восточной части США? Что я пытаюсь понять, так это то, что фабрика данных делает что-то умное, чтобы использовать службу перемещения данных в наиболее подходящем регионе в зависимости от того, куда и куда поступают данные.

Вторым абстрактным примером будет загрузка данных из хранилища больших двоичных объектов в Австралии в базу данных SQL в Австралии. Я знаю, что есть и другие способы сделать это, но, скажем, мне пришлось использовать фабрику данных. ADF недоступен в Австралии, поэтому я бы остановил его где-нибудь в Северной Европе, будут ли мои данные перемещаться из Австралии в Северную Европу и обратно в Австралию? Или же аспект перемещения данных в ADF будет более умным и будет делать это локально?

Следующим аспектом будет Integration Runtime. Всегда ли IR является данными обратно в регион, в котором размещен ADF для обработки?

Спасибо.

1 Ответ

0 голосов
/ 10 мая 2018

Служба перемещения данных является частью службы фабрики данных, которая является реальной вычислительной средой для передачи данных. Это означает, что когда вы копируете данные из Австралии в Австралию, независимо от того, где находится фабрика данных (например, в восточной части США), она будет использовать службу перемещения данных в Австралии для завершения копирования. Регион фабрики данных - это регион для хранения метаданных фабрики данных.

Для автономных ИК-потоков поток данных не возвращается к фабрике данных. Автономный ИК-порт будет подключаться как к источнику данных, так и к источнику данных приемника для передачи данных (подробности см. https://docs.microsoft.com/en-us/azure/data-factory/create-self-hosted-integration-runtime#command-flow-and-data-flow)

Вот еще некоторые подробности, если вы заботитесь о регионе: для Cloud Copy, Copy Activity автоматически обнаружит область источника данных приемника и использует службу перемещения данных в этом регионе для завершения копирования. При создании нового конвейера из пользовательского интерфейса CopyWizard вы увидите регион, который будет использоваться. И когда копирование завершено, вы также можете увидеть регион выполнения региона на сводной странице.

С уважением, Gary

...