Я попытался запустить SQL следующим образом:
select count(*) from test_table where columna='a' and columnb in ('test1', test2')
Для Impala в Cloudera это занимает около 2 минут, но для Hive это занимает 20 минут, не уверен, это нормально? если да, то почему Импала работает намного быстрее, чем Улей в Клодере? и в каком сценарии Hive будет быстрее, чем Impala?
Спасибо.