У меня есть две таблицы улья с именами omniture3
и omniture4
.Размер обеих таблиц составляет 50*20
каждая.
Я выполняю JOIN
запрос к таблицам, но его выполнение занимает слишком много времени!Кластер Hadoop состоит из одного узла.
Я знаю, что запрос куста занимает много времени на больших таблицах, поэтому я уменьшил размер таблицы, но все же он не выполняется (это уже более получасаи он все еще застрял).
Ниже приведен запрос:
SELECT omniture3.*, omniture4.* FROM omniture3 JOIN omniture4 on (omniture3.id = omniture4.id) LIMIT 10;
Сколько времени эти запросы обычно занимают для данного размера таблиц, и если это время нормальное, как можноЯ ускоряю процесс?
Редактировать: у меня есть кластер с 2 узлами (1 датодода и 1 наменод), и каждому узлу выделено 4 ГБ ОЗУ)