Я надеялся, что ученый ответит на этот вопрос и скажет мне, что я был глуп, чтобы спросить, но вот мои нынешние мысли, может быть, это выведет ее ... путь вперед, как я вижу это ниже.
Учитывая только права на чтение, лучше всего сначала извлечь все данные из разных источников в среду, на которую у меня есть полные права разработки (например, сервер PostgreSQL или MySQL на локальном хосте, если он небольшой ... или, возможно, на одном месте разработки на Azure, которыйпредприятие допускает полное развитие прав).Создайте это в инструменте ETL, то есть в SSIS, и запустите, так как обновленные данные необходимы для любой дельты в источнике.Впоследствии выполните объединения на этих консолидированных данных.
Это имеет смысл, поскольку мне нужно поэкспериментировать с объединениями, имея дело с достаточно маленьким или передаваемым объемом данных, чтобы дублирование данных не являлось проблемой ресурсов и выполняло бы экспериментальные объединения непосредственно в SQLредактор вместо инструмента ETL.
Если бы у меня был намного больший набор данных, я бы попытался сэмплировать, выполнить то же упражнение, а затем, как только было понято соединение между серверами, выполнить его в масштабе в инструменте ETL, вероятнокаким-то периодическим способом, который в идеале мог бы быть в конечном счете выполнен параллельно.