Я запускаю parallel
вот так, абстрагируясь от некоторых деталей:
generate_job_list | parallel -j10 -q bash -c 'echo -n "running {}" ; dostuff {}'
Я заметил, что иногда дочерние процессы, которые порождают parallel
, умирают, получив SIGKILL (я знаю, потому что dostuff
- это команда psql
для запуска вакуума, и журналы Postgres сообщают мне, что команда получила SIGKILL). У меня не установлен тайм-аут, поэтому мне не ясно, что могло бы сделать что-то подобное. Это происходит после того, как дочерний процесс работал в течение нескольких часов.
Имеет ли parallel
тайм-аут по умолчанию (документы, похоже, не предполагают этого) или какие-либо другие идеи о том, что может быть причиной этого?
ETA : Добавьте некоторые вещи, которые помогли мне найти это, в основной части вопроса, потому что это может помочь другим, кто испытывает ту же проблему, найти этот вопрос.
В ваших журналах Postgres вы должны найти такие сообщения:
LOG: received smart shutdown request
LOG: autovacuum launcher shutting down
FATAL: the database system is shutting down
, который будет сгенерирован, несмотря на то, что вы не просили Postgres завершить работу.