Это - второй случай - из-за не очень известного параметра "hive.fetch.task.conversion" .
В зависимости от того, как установлено, Hive может запустить одну «задачу извлечения» вместо задания «Уменьшить карту» даже с фильтром, т. Е. Предложением where.
Если вы выберете *или неразделенный столбец, он запустит задачу извлечения вместо задания MR - одиночный поток.Отдельная тема не всегда хорошая вещь.Счетчик (*) должен говорить сам за себя, потенциально вам нужно много обработать, второй случай можно рассматривать как курсор.
Вы можете изменить параметр на «минимальный» или «нет» в кусте.site.xml, чтобы устранить этот тип обработки.
Хорошо заметили.