Я новичок в использовании движка Tez. Я выполняю запросы куста на движке Tez, и кажется, что запрос использует все доступные ресурсы. Я хотел бы знать, есть ли способ контролировать количество запущенных контейнеров. Например, как мы контролируем в Spark с помощью конфигураций --executor-cores и --num-executors.
Я искал и не смог найти ничего конкретного. Кроме того, я не хочу различать его через очередь (поскольку я запускаю его на EMR с параметрами масштабирования и определение масштабирования на основе нескольких очередей, усложняет настройку).
Обновление 1: с информацией о вершинах
VERTICES MODE STATUS TOTAL COMPLETED RUNNING PENDING FAILED KILLED
----------------------------------------------------------------------------------------------
Map 1 container RUNNING 17 0 11 6 0 0
----------------------------------------------------------------------------------------------
Приведенный выше запрос запускает 1 вершину, в которой 11 задач выполняются параллельно (с использованием всех 11 ресурсов кластера). Я бы хотел контролировать количество одновременно выполняемых задач в вершине (в этом примере от 11 до 3).