Hive on Spark не возвращает результатов при агрегации или запросах к объединению - PullRequest
1 голос
/ 10 июня 2019

Агрегация или объединение не возвращают результатов запросов Hive на внешнюю таблицу.

У меня настроен куст для использования Spark (автономно) в качестве механизма запросов вместо MR.

Я создалвнешняя таблица (из индекса elastichsearch).

С SELECT все в порядке и возвращаются данные:

SELECT * FROM table1 LIMIT 100

Попробуйте с простым подсчетом, нет возврата данных:

SELECT count(*) FROM table1

Я использую JDBC (beeline) для выполнения запроса в Hive

Из журналов кажется, что запрос на выбор выполняется непосредственно на эластичном (без задания искры)порождать).Когда выполняется запрос на подсчет, запускается искровое задание, и оно завершается успешно, но возвращается любой результат.

1 Ответ

0 голосов
/ 10 июня 2019

Видимо, соединение, которое вы используете, отфильтровывает все записи.Убедитесь, что условие, к которому вы присоединяетесь, существует в обеих таблицах.Попробуйте изменить тип объединения с внутреннего на левое и посмотрите, есть ли у вас какие-либо результаты.

Если вам все еще не удается, можете ли вы добавить образец из двух таблиц, к которым вы пытаетесь присоединиться?

Дайте мне знать.

...