Использование функции groupby в Hive для получения количества категорий, но одна категория отсутствует в выходной таблице, так как данные недоступны во входной таблице - PullRequest
1 голос
/ 04 октября 2019

Проблема со сценарием Hive: у меня проблема с получением подсчета по группам с использованием Hive, когда это значение равно нулю. Если категория доступна во входной таблице, я смог увидеть количество в выходной таблице. Но когда конкретная категория недоступна во входной таблице, она не отображается как ноль в выходной таблице. Вместо этого эта категория исчезает из выходной таблицы. Любая помощь здесь высоко ценится. Заранее спасибо.

Таблицы ввода и вывода: enter image description here

Таблица ввода разбита на столбец «Год».

HiveКод, который я пробовал:

enter image description here

1 Ответ

0 голосов
/ 04 октября 2019

Вы можете настроить свой запрос .. это, возможно, не самый оптимизированный подход, но это то, что я могу вспомнить

  1. В результате вы получили таблицу вывода кода в результате запроса
  2. Вы можете использовать левое соединение с code_output_table для года и ada

https://searchoracle.techtarget.com/answer/How-to-return-a-zero-in-SQL-instead-of-no-row-back-for-a-select-count

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...