ОБЪЕДИНЕНИЕ ВСЕ более 2 больших просмотров SQL против Python / Pands - PullRequest
0 голосов
/ 06 февраля 2020

Как выбрать отдельные имена столбцов из 2 представлений?

У меня есть 2 больших представления, каждый из которых содержит около 40 столбцов, созданных из различных таблиц.

Пример, приведенный здесь

показывает, как их объединить, если не доступно другое решение.

Я создаю таблицу с UNION ALL, поэтому мне нужно найти способ выбрать отдельные столбцы из обоих взгляды.

Если есть какой-то простой способ сделать это в DataGrip или SQL Server Management Studio, было бы неплохо. А теперь длинный вопрос с ожидаемым ответом, но я должен спросить: есть ли шанс запустить U- SQL над MS SQL 2016? Ответ, вероятно, "нет", но этот кажется ужасно привлекательным, потому что он будет сводить все на

t1 | union kind=outer t2;

Если я использую для этого на сервере python / pandas, это будет просто df_union_all= pd.concat([v1, v2]) принято, что сначала мне нужно извлечь эти представления в кадрах данных.

Может кто-нибудь дать мне сравнение производительности для этих двух случаев (SQL против python / pandas). Таблицы имеют размер около 100 миллионов (10 ГБ) и 20 миллионов (2 ГБ) строк / пространство большого размера со смешанными типами данных (varchar, nvarchar, int).

...