У меня есть две таблицы Hive: Table1, Table2. Таблица1 содержит повторяющиеся строки, а Таблица2 - нет. Я хочу получить недостающие данные из Таблицы1, которых нет в Таблице2, включая дубликаты. Как я могу сделать это на языке запросов Hive?
Пример:
Данные таблицы 1:
Col1,Col2
A1,V1
A1,V1
A2,V2
A3,V3
A3,V3
A3,V3
A4,V4
Данные таблицы 2:
Col1,Col2
A1,V1
A2,V2
A3,V3
I хотите получить следующие отсутствующие данные из таблицы 1:
Col1,Col2
A1,V1
A3,V3
A3,V3
A4,V4