Linux: Как отладить SIGSEGV? Как отследить источник ошибок? - PullRequest
7 голосов
/ 21 июня 2009

Мой firefox начал падать с сегодняшнего дня. Я ничего не изменил в системе или в конфигурации Firefox.

Я использую
strace -ff -o dumpfile.txt firefox
чтобы проследить проблему. Это не большая помощь.

Я вижу segfault в двух сгенерированных дампах процессов, но как я могу проследить их до их причины?

После 10 секунд работы и сбоя 22MB данных генерируется strace.

Это фрагмент вывода, где вы можете увидеть фактический SIGSEGV посередине.

read(19, "\372", 1)                     = 1
gettimeofday({1245590019, 542231}, NULL) = 0
read(3, "\6\0[Qmy\26\0\3\1\0\0Y\0\200\2\0\0\0\0\323\3A\0\323\3(\0\20\0\1\0", 4096) = 32
read(3, 0xf5c55058, 4096)               = -1 EAGAIN (Resource temporarily unavailable)
gettimeofday({1245590019, 542813}, NULL) = 0
poll([{fd=4, events=POLLIN}, {fd=3, events=POLLIN}, {fd=8, events=POLLIN|POLLPRI}, {fd=12, events=POLLIN|POLLPRI}, {fd=13, events=POLLIN|POLLPRI}, {fd=14, events=POL
read(3, 0xf5c55058, 4096)               = -1 EAGAIN (Resource temporarily unavailable)
gettimeofday({1245590019, 543161}, NULL) = 0
gettimeofday({1245590019, 546672}, NULL) = 0
gettimeofday({1245590019, 546761}, NULL) = 0
read(3, 0xf5c55058, 4096)               = -1 EAGAIN (Resource temporarily unavailable)
gettimeofday({1245590019, 546936}, NULL) = 0
poll([{fd=4, events=POLLIN}, {fd=3, events=POLLIN}, {fd=8, events=POLLIN|POLLPRI}, {fd=12, events=POLLIN|POLLPRI}, {fd=13, events=POLLIN|POLLPRI}, {fd=14, events=POL
poll([{fd=3, events=POLLIN|POLLOUT}], 1, 4294967295) = 1 ([{fd=3, revents=POLLOUT}])
writev(3, [{"5\30\4\0006\21\200\2\266\n\200\2\17\0]\3\230\4\5\0007\21\200\0026\21\200\2\317\0\0\0"..., 1624}, {NULL, 0}, {"", 0}], 3) = 1624
poll([{fd=3, events=POLLIN}], 1, 4294967295) = 1 ([{fd=3, revents=POLLIN}])
read(3, "\1\30\224Q\17\17\0\0\0\0\0\0\0\0\0\0000\235\273\0\0\0\0\0o\264Q\0\0\0\0\0"..., 4096) = 4096
read(3, "\375\240f\0\376\242j\0\377\261\200\0\271a+\0\271a+\0\377\261\200\0\376\252w\0\376\250s\0"..., 11356) = 11356
read(3, 0xf5c55058, 4096)               = -1 EAGAIN (Resource temporarily unavailable)
poll([{fd=3, events=POLLIN|POLLOUT}], 1, 4294967295) = 1 ([{fd=3, revents=POLLOUT}])
writev(3, [{"\230\32\7\0\1\21\200\2?\21\200\2\377\377\377\377\377\377\377\377\0\0\0\0\17\0\1\0015\10\4\0"..., 956}, {NULL, 0}, {"", 0}], 3) = 956
poll([{fd=3, events=POLLIN}], 1, 4294967295) = 1 ([{fd=3, revents=POLLIN}])
read(3, "\1\30\256Q\17\17\0\0\0\0\0\0\0\0\0\0000\235\273\0\0\0\0\0o\264Q\0\0\0\0\0"..., 4096) = 4096
read(3, "\375\240f\0\376\242j\0\377\261\200\0\271a+\0\271a+\0\377\261\200\0\376\252w\0\376\250s\0"..., 11356) = 11356
read(3, 0xf5c55058, 4096)               = -1 EAGAIN (Resource temporarily unavailable)
--- SIGSEGV (Segmentation fault) @ 0 (0) ---
unlink("/home/userrrr/.mozilla/firefox/mvbnkitl.default/lock") = 0
rt_sigaction(SIGSEGV, {SIG_DFL, ~[HUP INT QUIT ABRT BUS FPE KILL PIPE CHLD CONT TTOU URG XCPU WINCH RT_1 RT_2 RT_3 RT_4 RT_8 RT_11 RT_14 RT_17 RT_22], SA_NOCLDSTOP},
rt_sigprocmask(SIG_BLOCK, ~[ILL ABRT BUS FPE SEGV RTMIN RT_1], ~[KILL STOP RTMIN RT_1], 8) = 0
open("/home/userrrr/.mozilla/firefox/mvbnkitl.default/minidumps/56b30367-5ee2-0495-32646b7f-59dc87e9.dmp", O_WRONLY|O_CREAT|O_EXCL, 0600) = 63
clone(child_stack=0xf5bfffe4, flags=CLONE_VM|CLONE_FS|CLONE_FILES|CLONE_UNTRACED) = 18929
waitpid(18929, NULL, __WALL) = 18929
open("/proc/18913/task", O_RDONLY|O_NONBLOCK|O_LARGEFILE|O_DIRECTORY|O_CLOEXEC) = 64
fstat64(64, {st_mode=S_IFDIR|0555, st_size=0, ...}) = 0
getdents64(64, /* 12 entries */, 1024)  = 368
ptrace(PTRACE_DETACH, 18913, 0, SIG_0)  = -1 ESRCH (No such process)
close(64)                               = 0
ftruncate(63, 91256)                    = 0
close(63)                               = 0
rt_sigprocmask(SIG_SETMASK, ~[KILL STOP RTMIN RT_1], ~[KILL STOP RTMIN RT_1], 8) = 0
time(NULL)                              = 1245590020
open("/home/userrrr/.mozilla/firefox/Crash Reports/LastCrash", O_WRONLY|O_CREAT|O_TRUNC, 0600) = 63
write(63, "1245590020", 10)             = 10

Ответы [ 2 ]

21 голосов
/ 21 июня 2009

Иван, твой реальный вопрос: "Как мне отладить SIGSEGV?"

strace здесь редко помогают. SIGSEGV означает, что приложение пыталось разыменовать (получить доступ) место в памяти, которое не было выделено (или не разрешено разыменовываться по различным другим причинам). Высоки шансы, что это не связано с активностью системных вызовов, которую захватывает strace. Чтобы выяснить причину сбоя, начните с понимания того, какой адрес разыменовывается и какая функция пытается это сделать. Отладчик - правильный инструмент для этой задачи.

Вот что вам нужно сделать:

 gdb <your_app_name> <your_coredump_file>

там, анализируя последнюю выполненную инструкцию и используя «информационные регистры», вы увидите соответствующий адрес. С помощью команды "bt" вы увидите колл-стэк. Подойдя к стеку вызовов, вы узнаете, как вычисляется неправильный адрес. Причиной вашей проблемы является один из этапов расчета адреса.

Отладка - это весело, и это хорошая возможность углубиться в это. Там вам может помочь хорошая книга или несколько статей в Интернете. Гугл прочь и удачи!

7 голосов
/ 22 июня 2009

Вы можете запустить Firefox в режиме отладки с помощью этого: firefox -d gdb

это запустит Firefox внутри GDB.

Вы можете выполнить команду gdb 'run' и получить трассировку при сбое firefox. Это может быть сложно, так как Firefox поставляется с раздетыми библиотеками, которые только показывают, какие библиотека и смещение, в котором находится код, а не имена функций.

Другой альтернативой является запуск firefox в безопасном режиме: firefox -safe-mode и отключите все плагины, которые вы, возможно, установили, пока он не перестанет работать.

Последняя альтернатива - включить режим разработчика Firefox и разрешить ему отправлять сеанс аварийного завершения Firefox на сервере Mozilla. Тогда вы можете перейти на сайт Mozilla и посмотрите подробный отчет о вашей неудачной сессии Firefox.

...