Контролировать использование памяти дочерним процессом - PullRequest
5 голосов
/ 02 мая 2010

У меня есть демон Linux, который разветвляет нескольких детей и отслеживает их на предмет сбоев (перезапуск по мере необходимости). Было бы хорошо, если бы родитель мог контролировать использование памяти дочерними процессами - обнаруживать утечки памяти и перезапускать дочерние процессы, когда выход за пределы определенного размера. Как я могу это сделать?

Ответы [ 2 ]

4 голосов
/ 02 мая 2010

Вы должны быть в состоянии получить подробную информацию о памяти из / proc / {PID} / status:

Name:   bash
State:  S (sleeping)
Tgid:   6053
Pid:    6053
PPid:   6050
TracerPid:  0
Uid:    1007    1007    1007    1007
Gid:    1007    1007    1007    1007
FDSize: 256
Groups: 1007 
VmPeak:    48076 kB
VmSize:    48044 kB
VmLck:         0 kB
VmHWM:      4932 kB
VmRSS:      2812 kB
VmData:     2232 kB
VmStk:        84 kB
VmExe:       832 kB
VmLib:      6468 kB
VmPTE:       108 kB
Threads:    1
SigQ:   0/8190
SigPnd: 0000000000000000
ShdPnd: 0000000000000000
SigBlk: 0000000000000000
SigIgn: 0000000000001010
SigCgt: 0000000188020001
CapInh: 0000000000000000
CapPrm: 0000000000000000
CapEff: 0000000000000000
Cpus_allowed:   0f
Mems_allowed:   00000000,00000001
voluntary_ctxt_switches:    69227121
nonvoluntary_ctxt_switches: 19071

Однако, если утечки памяти не являются существенными, их трудно обнаружить, просматривая статистику процесса, потому что malloc и free обычно довольно абстрактны от системных вызовов (brk / sbrk), которым они соответствуют.

Вы также можете проверить в /proc/$ndomPID‹/statm.

.
1 голос
/ 02 мая 2010

вы можете попробовать запустить скрипт vmstat параллельно с вашим процессом (обратите внимание, что это не очень хорошая идея, если вы запускаете этот скрипт несколько раз, так как получите несколько копий vmstat). Затем этот скрипт монитора может взять свободную память, а также размер буфера и кеша, чтобы получить объем памяти, доступный ОС, и вы можете отслеживать это. Затем, если это становится ниже некоторого порога, вы можете проверить самые большие процессы, вызвав ps -e -o ... (подробности см. На странице man, но в качестве отправной точки попробуйте vsz, pcpu, user, pid, args).

Я бы посоветовал запускать этот монитор как отдельный процесс и убивать мошеннический процесс, когда он становится слишком большим. Вы можете ограничить набор контролируемых процессов с помощью

-u user-name

параметр в пс.

Это все взлом (в британском значении), хотя - правильное решение - исправить утечки, если у вас есть код.

...