Задачи регулярно не работают в наших группах DAG, и после выполнения действий Google по устранению неполадок я определил первопричину выселения памяти из-за нехватки памяти.
Это соответствует тому, что я ' m видя в графе «Использование памяти на узел» на вкладке Composer Мониторинг. Наша машина поддерживает узлы 8 ГБ, а самые большие пики - 16 ГБ.
Снимок экрана с графиком использования памяти на каждый узел, на котором показаны всплески памяти
Где я застрял определяет, какие группы DAG вызывают всплески памяти. (Я предполагаю, что «DAG A» может вызвать всплеск памяти, который привел к удалению «DAG B»). Я хотел бы вернуться к коду, чтобы увидеть, можно ли его оптимизировать, прежде чем увеличивать размер машины.
Как мне соединить точки, чтобы понять, какие задачи обрабатывались данным узлом Kubernetes в данный момент?