Добрый день!
В нашем проекте мы используем подсистему для извлечения электронной почты из удаленных IMAP. Подсистема содержит несколько пулов процессоров с диспетчером над ними. Бассейны имеют ограниченное количество процессов внутри них. Среднее время жизни процесса в бассейне составляет около 5 минут.
Я столкнулся со следующей проблемой: в течение дня несколько раз некоторые процессы сходили с ума. Они постоянно потребляют память, а затем меняются местами. В результате 70-80% памяти используется одной прецессией. И это имеет довольно печальные последствия для других процессов на узле.
Я хотел бы спросить о методах и подходах для профилирования таких ситуаций.
(Я пытался использовать strace на таких сумасшедших процессах, но не повезло - вывод пуст)
Спасибо за любую помощь!