ядро - ошибка postgres segfault 15 в libc-2.19.so - PullRequest
0 голосов
/ 19 октября 2018

Вчера у нас был сбой PostgreSQL 9.5.14, работающего на Debian 8 (Linux xxxxxx 3.16.0-7-amd64 # 1 SMP Debian 3.16.59-1 (2018-10-03) x86_64 GNU / Linux) - Ошибка сегментации,База данных закрыла все соединения и реинициализировала себя, оставаясь в режиме восстановления ~ 1 минуту.

Журнал PostgreSQL:

2018-10-xx xx: xx: xx UTC [580-2] LOG: серверный процесс (PID 16461) был прерван сигналом 11: ошибка сегментации

kern.log:

окт. xx xx: xx: xx xxxxxxxx ядро: [117977.301353]postgres [16461]: segfault at 7efd3237db90 ip 00007efd3237db90 sp 00007ffd26826678 ошибка 15 в libc-2.19.so [7efd322a2000 + 1a1000]

Согласно документации libc (https://support.novell.com/docs/Tids/Solutions/10100304.html) код ошибки 15 означает: код ошибки 15: 15NX_EDEADLK 15 resource deadlock would occur - что мне мало что говорит.

Не могли бы вы сказать, пожалуйста, если мы сможем что-то сделать, чтобы избежать этой проблемы в будущем? Потому что этот сервер, конечно, производственный. Все пакеты обновлены.в настоящее время. Обновление PG, к сожалению, не вариант. Сервер работает на Google Compute Engine.

1 Ответ

0 голосов
/ 20 октября 2018

код ошибки 15 означает: NX_EDEADLK 15

Нет, это не означает , что означает. Этот ответ объясняет, как здесь интерпретировать 15.

Это биты 0, 1, 2, 3 set => ошибка защиты, доступ на запись, режим пользователя, использование зарезервированного бита.Скорее всего, ваш postgress процесс попытался записать в какой-нибудь дикий указатель.

, если мы сможем что-то сделать, чтобы избежать этой проблемы в будущем?

единственное, что вы можете сделать * 1019, - это найти ошибку и исправить ее, или обновить ее до версии postgress, где эта ошибка уже исправлена ​​(и надеюсь, что новые не были введены).

Чтобы понятьгде ошибка может быть, вы должны проверить, был ли создан дамп core (если нет, включите их).Если у вас есть core, используйте команду gdb /path/to/postgress /path/to/core, а затем where GDB.Это даст вам трассировку стека сбоев, что может позволить вам найти похожие сообщения об ошибках.

...