У нас есть простой запрос на hive на emr (hive-emr 2.3.5) - таблица разбита на столбец A, и мы запрашиваем файлы паркета в S3 с Tez в качестве механизма выполнения.
SELECT A, B, C FROM TABLE WHERE A = 'foo' and B='bar' LIMIT 10;
При выполнении этого запроса запрос зависает. Он никогда не отправляется в Tez, он никогда не запускает никакие мапперы.
Если мы удалим предложение B = 'bar', оно будет работать нормально (мапперы не нужны, так как это просто работа с ограничениями). Если мы используем таблицу создания в качестве выбора этой таблицы, она снова работает нормально и создает: CREATE TABLE temp.test AS SELECT A, B, C FROM TABLE WHERE A = 'foo' and B='bar' LIMIT 10;
У кого-нибудь есть какие-либо идеи о том, как диагностировать, что идет не так?