Отладка GDB OpenJDK Java в Alpine Linux завершается с ошибкой «Поток принят сигнал? Неизвестный сигнал» - PullRequest
0 голосов
/ 31 августа 2018

Я с трудом пытаюсь отладить Java OpenJDK в Alpine Linux с помощью gdb - кому-нибудь это удалось?

При попытке отладки Java в GDB, например, gdb java и r -version, он мгновенно завершается с ошибкой:

Thread 1 "java" recieved signal ?, Unknown signal.
__cp_end () at src/thread/x86_64/syscall_cp.s:29

Я искал и искал, но не смог найти ни ссылки, ни решения для отладки OpenJDK на Alpine.

Другие потоки, имеющие дело с той же ошибкой GDB, замеченной на других платформах (macOS Sierra, MinGW), предполагают, что recieved signal ?, Unknown signal может быть вызвано различными причинами, включая ошибку gdb , uncaught исключения , переполнение стека и другие ошибки приложения.

За пределами gdb java работает без проблем, а gdb отлично работает для отладки простой программы на C ++. Я использую Alpine V3.8.

Вещи, которые я пробовал:

  • Различные версии GDB (8.0.1-r6, 8.0.1-r3, 7.12.1-r1).
  • Различные версии OpenJDK (1.8.0_171, 1.7.0_181).
  • Запуск из разных оболочек (/bin/ash, /bin/bash), с и без sudo.
  • Отключение остановки по сигналам в .gdbinit: handle SIGSEGV nostop noprint pass, и то же самое для SIGPIPE, SIGHUP, SIGFPE, SIG34.
  • Добавление set startup-with-shell off к .gdbinit.

Спасибо за любую помощь!

Edit:

Вот полный стек, в который выдается неизвестный сигнал, что приводит к сбою JVMInit :

(gdb) r -version
Starting program: /usr/lib/jvm/java-1.8-openjdk/bin/java -version
process 16214 is executing new program: /usr/lib/jvm/java-1.8-openjdk/bin/java
[New LWP 16219]

Thread 1 "java" received signal ?, Unknown signal.
__cp_end () at src/thread/x86_64/syscall_cp.s:29
29  src/thread/x86_64/syscall_cp.s: No such file or directory.
(gdb) info threads
  Id   Target Id         Frame 
* 1    LWP 16214 "java"  __cp_end () at src/thread/x86_64/syscall_cp.s:29
  2    LWP 16219 "java"  __synccall (func=func@entry=0x7ffff7da2662 <do_setrlimit>, ctx=ctx@entry=0x7ffff7ff4720)
    at src/thread/synccall.c:143
(gdb) where
#0  __cp_end () at src/thread/x86_64/syscall_cp.s:29
#1  0x00007ffff7dbed2d in __syscall_cp_c (nr=202, u=<optimized out>, v=<optimized out>, w=<optimized out>, x=<optimized out>, 
    y=<optimized out>, z=0) at src/thread/pthread_cancel.c:35
#2  0x00007ffff7dbe350 in __timedwait_cp (addr=addr@entry=0x7ffff7ff4b20, val=16219, clk=clk@entry=0, at=at@entry=0x0, priv=priv@entry=0)
    at src/thread/__timedwait.c:31
#3  0x00007ffff7dbfdc4 in __pthread_timedjoin_np (t=0x7ffff7ff4ae8, res=res@entry=0x7fffffffa348, at=at@entry=0x0)
    at src/thread/pthread_join.c:16
#4  0x00007ffff7dbfe02 in __pthread_join (t=<optimized out>, res=res@entry=0x7fffffffa348) at src/thread/pthread_join.c:27
#5  0x00007ffff7b6695e in ContinueInNewThread0 (continuation=continuation@entry=0x7ffff7b61a60 <JavaMain>, stack_size=1048576, 
    args=args@entry=0x7fffffffa3e0)
    at /home/buildozer/aports/community/openjdk8/src/icedtea-3.8.0/openjdk/jdk/src/solaris/bin/java_md_solinux.c:1046
#6  0x00007ffff7b634a4 in ContinueInNewThread (ifn=ifn@entry=0x7fffffffa4f0, threadStackSize=<optimized out>, argc=1, 
    argv=<optimized out>, mode=mode@entry=841574793, what=what@entry=0x0, ret=0)
    at /home/buildozer/aports/community/openjdk8/src/icedtea-3.8.0/openjdk/jdk/src/share/bin/java.c:2024
#7  0x00007ffff7b66a08 in JVMInit (ifn=ifn@entry=0x7fffffffa4f0, threadStackSize=<optimized out>, argc=<optimized out>, 
    argv=<optimized out>, mode=841574793, mode@entry=0, what=what@entry=0x0, ret=<optimized out>)
    at /home/buildozer/aports/community/openjdk8/src/icedtea-3.8.0/openjdk/jdk/src/solaris/bin/java_md_solinux.c:1093
#8  0x00007ffff7b63e30 in JLI_Launch (argc=<optimized out>, argv=<optimized out>, jargc=<optimized out>, jargv=<optimized out>, 
    appclassc=1, appclassv=0x0, fullversion=0x555555554843 "1.8.0_171-b11", dotversion=0x55555555483f "1.8", pname=0x55555555483a "java", 
    lname=0x555555554832 "openjdk", javaargs=0 '\000', cpwildcard=1 '\001', javaw=0 '\000', ergo=0)
    at /home/buildozer/aports/community/openjdk8/src/icedtea-3.8.0/openjdk/jdk/src/share/bin/java.c:304
#9  0x0000555555554691 in main (argc=<optimized out>, argv=<optimized out>)
    at /home/buildozer/aports/community/openjdk8/src/icedtea-3.8.0/openjdk/jdk/src/share/bin/main.c:125
(gdb) 

Исходные файлы musl, соответствующие этой трассировке стека:

Исходный код OpenJDK:

JVMInit пытается создать собственный поток JavaMain, вызывая ContinueInNewThread, который вызывает ContinueInNewThread0(JavaMain, threadStackSize, (void*)&args), и там он взрывается.

1 Ответ

0 голосов
/ 03 сентября 2018

TL; DR: проблема в том, что GDB не поддерживает внутренние сигналы musl, о которых сообщается в этом билете gdb .

Быстрый и грязный исправленный GDB доступен здесь:
https://github.com/shaharv/alpine-gdb-builds/releases/tag/v0.1

Патч-коммит: shaharv / binutils-gdb @ 0ca9c66 .

С патчем сигнал правильно идентифицируется как SIGSYNCCALL.
Тогда его можно замаскировать, используя handle SIGSYNCCALL nostop noprint pass.


К счастью, я смог найти обходной путь!
Сбой GDB при отладке Java Alpine OpenJDK можно обойти следующим образом:

  • Start GDB
  • break os::init_2
  • Запустите Java с нужными аргументами командной строки
  • Когда достигается точка останова, set MaxFDLimit=0
  • Продолжить и отладить как обычно.

Я тестировал обходной путь с ранним доступом OpenJDK 8 и 11, поэтому он, вероятно, будет работать и с OpenJDK 9 и 10.

К сожалению, область применения этого обходного пути очень ограничена:

  • Это работает, только если JDK имеет символы отладки - будь то локальная отладочная сборка OpenJDK или использующий пакет openjdk8-dbg отладочных символов.
  • Он подходит только для командной строки GDB и не будет работать с внешними интерфейсами GDB, такими как CLion и Eclipse CDT.

Резюме:

Сбой происходит, когда внутри GDB вызывается функция setrlimit. Реализация musl setrlimit сигнализирует потоки с SIGSYNCCALL, который не поддерживается gdb, и приводит к ошибке Unknown signal. Во избежание ошибки соответствующий код инициализации JavaMain отключается отключением глобальной переменной MaxFDLimit.

Полное объяснение:

Во время инициализации JVM создается собственный поток JavaMain, который создает виртуальную машину. Во время создания виртуальной машины происходит специфическая инициализация ОС, в которой вызывается setrlimit. Вот соответствующая часть трассировки стека:

#0  __synccall (func=func@entry=0x7ffff7da2662 <do_setrlimit>, ctx=ctx@entry=0x7ffff7ff4720) at src/thread/synccall.c:48
#1  0x00007ffff7da26a1 in setrlimit (resource=resource@entry=7, rlim=rlim@entry=0x7ffff7ff4750) at src/misc/setrlimit.c:42
#2  0x00007ffff73bd1fe in os::init_2 ()
    at /home/buildozer/aports/community/openjdk8/src/icedtea-3.8.0/openjdk/hotspot/src/os/linux/vm/os_linux.cpp:5096
#3  0x00007ffff746177d in Threads::create_vm (args=0x7ffff7ff4a20, canTryAgain=canTryAgain@entry=0x7ffff7ff4987)
    at /home/buildozer/aports/community/openjdk8/src/icedtea-3.8.0/openjdk/hotspot/src/share/vm/runtime/thread.cpp:3361
#4  0x00007ffff729cd48 in JNI_CreateJavaVM (vm=0x7ffff7ff4a10, penv=0x7ffff7ff4a18, args=<optimized out>)
    at /home/buildozer/aports/community/openjdk8/src/icedtea-3.8.0/openjdk/hotspot/src/share/vm/prims/jni.cpp:5221
#5  0x00007ffff7b61b0b in InitializeJVM (ifn=<synthetic pointer>, penv=0x7ffff7ff4a18, pvm=0x7ffff7ff4a10)
    at /home/buildozer/aports/community/openjdk8/src/icedtea-3.8.0/openjdk/jdk/src/share/bin/java.c:1231
#6  JavaMain (_args=<optimized out>)

Виновной является вызов функции setrlimit. Реализация musl setrlimit является AS-Safe , то есть ее можно вызывать из асинхронных обработчиков сигналов. Часть синхронизации обрабатывается путем вызова __synccall ( setrlimit.c ):

int setrlimit(int resource, const struct rlimit *rlim)
{
    struct ctx c = { .res = resource, .rlim = rlim, .err = -1 };
    __synccall(do_setrlimit, &c);
    if (c.err) {
        if (c.err>0) errno = c.err;
        return -1;
    }
    return 0;
}

__synccall ( synccall.c ) блокирует все сигналы, затем выполняет итерацию всех потоков процесса и отправляет им сигнал SIGSYNCCALL (и только когда все потоки подтверждают сигнал, do_setrlimit выполнено):

r = -__syscall(SYS_tgkill, pid, tid, SIGSYNCCALL);

Однако сигнал SIGSYNCCALL является внутренним для musl и не обрабатывается GDB. GDB явно обрабатывает все типы сигналов, но SIGSYNCCALL не включен в обработанные сигналы (см. сигналов GDB. C ). Поэтому, когда сигнал повышается, GDB завершается с ошибкой Unknown signal.

Обход:

Обходной путь - отключение вызова на setrlimit в OpenJDK на лету. Соответствующий код находится в функции os::init_2 ( os_linux.cpp ):

  if (MaxFDLimit) {
    // set the number of file descriptors to max. print out error
    // if getrlimit/setrlimit fails but continue regardless.
    struct rlimit nbr_files;
    int status = getrlimit(RLIMIT_NOFILE, &nbr_files);
    if (status != 0) {
      if (PrintMiscellaneous && (Verbose || WizardMode))
        perror("os::init_2 getrlimit failed");
    } else {
      nbr_files.rlim_cur = nbr_files.rlim_max;
      status = setrlimit(RLIMIT_NOFILE, &nbr_files);
      if (status != 0) {
        if (PrintMiscellaneous && (Verbose || WizardMode))
          perror("os::init_2 setrlimit failed");
      }
    }
  }

При установке MaxFDLimit в 0 приведенный выше код не выполняется, и инициализация ВМ может продолжаться в обычном режиме. Существует опция командной строки для переключения этой переменной, -XX:-MaxFDLimit, но она доступна на только для Solaris , поэтому у нас нет выбора, кроме как отключить эту переменную вручную внутри gdb.

Причина, по которой стоит MaxFDLimit, является исторической и предназначалась для увеличения предела по умолчанию для файловых дескрипторов в старых системах, которые имели очень низкий предел FD по умолчанию (256), как описано в JDK-8010126 . Alpine V3.8 имеет ограничение по умолчанию 1024, поэтому можно безопасно отключить этот код - и, если необходимо, ограничения можно увеличить с помощью ulimit, а не самой JVM.

...