Шаг 1: Создать таблицу Hive для набора входных данных.создать таблицу, если она не существует table1 (строка fld1, строка fld2) ФОРМАТ ROW РАЗДЕЛЕННЫЕ ПОЛЯ, ПРЕКРАЩАЕМЫЕ '\ t';(я предполагал, что разделитель полей равен \ t, вы можете заменить его фактическим разделителем)
Шаг 2: Запустите ниже, чтобы получить данные слияния, которые вы ищете
создатьтаблица table2 как выбор fld1, fld2 из группы table1 по fld1, fld2;
Я пробовал это для нижнего набора ввода
куст (по умолчанию)> выбор * из таблицы1;OK
A 1
A 1
A 1
B 1
C 1
B 1
создать таблицу table4 как выбрать fld1, fld2 из группы table1 с помощью fld1, fld2;
hive (по умолчанию)> select * from table4;OK
A 1
B 1
C 1
Вы также можете использовать внешнюю таблицу, но для простоты я использовал здесь управляемую таблицу.