Сколько времени занимает запрос Hive JOIN? - PullRequest
0 голосов
/ 31 мая 2019

У меня есть две таблицы улья с именами omniture3 и omniture4.Размер обеих таблиц составляет 50*20 каждая.

Я выполняю JOIN запрос к таблицам, но его выполнение занимает слишком много времени!Кластер Hadoop состоит из одного узла.

Я знаю, что запрос куста занимает много времени на больших таблицах, поэтому я уменьшил размер таблицы, но все же он не выполняется (это уже более получасаи он все еще застрял).

Ниже приведен запрос:

SELECT omniture3.*, omniture4.* FROM omniture3 JOIN omniture4 on (omniture3.id = omniture4.id) LIMIT 10;

Сколько времени эти запросы обычно занимают для данного размера таблиц, и если это время нормальное, как можноЯ ускоряю процесс?

Редактировать: у меня есть кластер с 2 узлами (1 датодода и 1 наменод), и каждому узлу выделено 4 ГБ ОЗУ)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...