Общие сведения о наборах данных ADF - PullRequest
0 голосов
/ 26 мая 2020

Я понимаю, что в Azure Фабрике данных набор данных представляет собой представление некоторых исходных данных. Можете ли вы создать единый набор данных из запроса, соединяющего две исходные таблицы? Или вам нужно создать два набора данных, поток данных с использованием преобразования соединения, чтобы создать третий набор данных в качестве приемника этого преобразования, что является желаемым результатом?

Похоже, что исходные таблицы - это не вещь в ADF, а только наборы данных (которые являются просто таблицами)? Я нахожу это очень запутанным и, возможно, не понимаю более высокого контекста.

1 Ответ

1 голос
/ 26 мая 2020

DataSet - это не представление данных, это указатель на местоположение и, возможно, описание схемы, найденной в этом месте. В вашем случае указатель на таблицу, поэтому да, вам понадобится DataSet для каждой таблицы SOURCE со схемой. Вы можете СОЕДИНЯТЬ их вместе в потоке данных, тогда вам понадобится другой DataSet для SINK. В зависимости от типа приемника вам может потребоваться создать схему, а может и не потребоваться.

Я предполагаю какой-то вариант SQL для таблиц - если да, и если две таблицы находятся в одной базе данных, тогда я бы рекомендовал выполнить JOIN в SQL, так как это будет быстрее и эффективнее. Если приемник также находится в той же базе данных, вы получите максимальную отдачу от хранимой процедуры, а не от потока данных.

...