вопрос размера данных импалы - PullRequest
0 голосов
/ 28 сентября 2018

Когда я выполняю запросы в Impala, размер данных, которые я читаю из профиля, составляет 10,04 ГБ (в одном узле Impalad).Пока я выполнял запрос, я использовал NMON для сбора дисковой матрицы.Размер данных, которые я рассчитал с использованием коллекции NMON, составляет 14,4 ГБ (на том же узле импалы).Итак, почему существует разрыв между этими числами буксировки (10,04 ГБ в профиле и 14,4 ГБ в nmon)?Я использую Impala версии 2.10.0, CDH версии 5.13.0 и четыре узла Impalad наряду с четырьмя узлами данных hdfs.К каждому узлу данных подключено 7 жестких дисков.

...