У меня есть четыре таблицы Hive:
A - 1.2 billion records and 250 GB
B - 4 billion records and 1 TB
C - 30 billion records and 2 TB
D - 2 billion records and 100 GB
Все таблицы не разбиты на разделы. A - родитель B (отношение внешнего ключа к одному), B - родитель C (один ко многим).отношение внешнего ключа) и C является родителем D (отношение внешнего ключа один ко многим)
Теперь я должен объединить эти таблицы;Что было бы лучшим подходом для объединения этих таблиц
Мне нужно создать таблицу E с столбцами из A, B, C, D дубликатов значений в столбцах A, B, C в порядке