Почему в журнале всегда отображается «Нет данных» при построении куба? - PullRequest
0 голосов
/ 28 апреля 2019

В случае sample на официальном сайте Kylin, когда я строил cube, на первом шаге Create Intermediate Flat Hive Table журнал всегда No Data Available, статус всегда running .

Построение куба выполнялось более трех часов.

Я проверил таблицу базы данных улья kylin_sales, и в таблице есть данные.

И я считаю, что промежуточная плоская таблица улья kylin_intermediate_kylin_sales_cube_402e3eaa_dfb2_7e3e_04f3_07248c04c10c была успешно создана в улье, но в ней нет данных.

hive> show tables;
OK
...
kylin_intermediate_kylin_sales_cube_402e3eaa_dfb2_7e3e_04f3_07248c04c10c
kylin_sales
...
Time taken: 9.816 seconds, Fetched: 10000 row(s)

hive> select * from kylin_sales;
OK
...
8992    2012-04-17  ABIN    15687   0   13  95.5336 17  10000975    10000507    ADMIN   Shanghai
8993    2013-02-02  FP-non GTC  67698   0   13  85.7528 6   10000856    10004882    MODELER Hongkong
...
Time taken: 3.759 seconds, Fetched: 10000 row(s)

Среда развертывания выглядит следующим образом:

  1. zookeeper-3.4.14
  2. hadoop-3.2.0
  3. hbase-1.4.9
  4. apache-hive-2.3.4-bin
  5. apache-kylin-2.6.1-bin-hbase1x
  6. openssh5.3
  7. jdk1.8.0_144

Я развернул кластер через докер и создал 3 контейнера, один ведущий, два ведомых.

Create Intermediate Flat Hive Table шаг запущен.

1 Ответ

0 голосов
/ 30 апреля 2019

No Data Available означает, что журнал этого шага не был захвачен Kylin. Обычно только когда шаг завершается (успешно или неудачно), журнал будет записан, тогда вы увидите данные.

В этом случае обычно это указывает на то, что Hive ожидает выполнения задания по многим причинам. Самый простой способ - посмотреть журнал Kylin, вы увидите CMD Hive, который выполняет Kylin, и затем вы можете запустить его вручную в консоли, а затем воспроизведите проблему. Пожалуйста, проверьте, имеет ли ваш Hive / Hadoop достаточно ресурсов (процессор, память) для выполнения такого запроса.

...