SIGSEGV в оптимизированной версии кода - PullRequest
10 голосов
/ 29 ноября 2011

Мои знания о наборе команд Intel немного устарели.Можете ли вы сказать мне, почему я могу получить ошибку сегментации в оптимизированной версии моей функции (бонусные баллы, если вы можете сказать мне, почему я не получаю это в сборке -O0 кода.

ЭтоКод на C, скомпилированный GCC 4.1.2.

Вот результат команды disas в GDB при сбое:

   0x00000000004263e5 <+0>:     sub    $0x8,%rsp
   0x00000000004263e9 <+4>:     movsd  %xmm2,(%rsp)
   0x00000000004263ee <+9>:     divsd  %xmm1,%xmm0
   0x00000000004263f2 <+13>:    callq  0x60f098 <log@plt>
=> 0x00000000004263f7 <+18>:    andpd  0x169529(%rip),%xmm0        
   0x00000000004263ff <+26>:    movsd  (%rsp),%xmm1
   0x0000000000426404 <+31>:    ucomisd %xmm0,%xmm1
   0x0000000000426408 <+35>:    seta   %al
   0x000000000042640b <+38>:    movzbl %al,%eax
   0x000000000042640e <+41>:    add    $0x8,%rsp
   0x0000000000426412 <+45>:    retq   

А вот оригинальный источник функции:

char is_within_range(double a, double b, double range) {
  double ratio = a / b;
  double logRatio = fabs(log(ratio));
  return logRatio < range;
}

Для справки приведем неоптимизированную версию кода:

   0x00000000004263e5 <+0>: push   %rbp
   0x00000000004263e6 <+1>: mov    %rsp,%rbp
   0x00000000004263e9 <+4>: sub    $0x30,%rsp
   0x00000000004263ed <+8>: movsd  %xmm0,-0x18(%rbp)
   0x00000000004263f2 <+13>:    movsd  %xmm1,-0x20(%rbp)
   0x00000000004263f7 <+18>:    movsd  %xmm2,-0x28(%rbp)
   0x00000000004263fc <+23>:    movsd  -0x18(%rbp),%xmm0
   0x0000000000426401 <+28>:    divsd  -0x20(%rbp),%xmm0
   0x0000000000426406 <+33>:    movsd  %xmm0,-0x10(%rbp)
   0x000000000042640b <+38>:    mov    -0x10(%rbp),%rax
   0x000000000042640f <+42>:    mov    %rax,-0x30(%rbp)
   0x0000000000426413 <+46>:    movsd  -0x30(%rbp),%xmm0
   0x0000000000426418 <+51>:    callq  0x610608 <log@plt>
   0x000000000042641d <+56>:    movapd %xmm0,%xmm1
   0x0000000000426421 <+60>:    movsd  0x16b6b7(%rip),%xmm0
   0x0000000000426429 <+68>:    andpd  %xmm1,%xmm0
   0x000000000042642d <+72>:    movsd  %xmm0,-0x8(%rbp)
   0x0000000000426432 <+77>:    movsd  -0x8(%rbp),%xmm1
   0x0000000000426437 <+82>:    movsd  -0x28(%rbp),%xmm0
   0x000000000042643c <+87>:    ucomisd %xmm1,%xmm0
   0x0000000000426440 <+91>:    seta   %al
   0x0000000000426443 <+94>:    movzbl %al,%eax
   0x0000000000426446 <+97>:    leaveq 
   0x0000000000426447 <+98>:    retq   

Ответы [ 3 ]

6 голосов
/ 29 ноября 2011
=> 0x00000000004263f7 <+18>:    andpd  0x169529(%rip),%xmm0        
   0x00000000004263ff <+26>:    movsd  (%rsp),%xmm1

Когда инструкция andpd принимает операнд памяти, ее необходимо выровнять по 16-байтовой границе.

Для относительной адресации %rip смещение применяется к адресу следующей инструкции. Итак, здесь операнд памяти находится в 0x4263ff + 0x169529 = 0x58f928, что не выровнено по 16 байтам. Отсюда и ошибка.

Компилятор напрямую генерирует код для fabs(), используя AND с соответствующей битовой маской для сброса знакового бита; значение константы битовой маски должно быть помещено с соответствующим смещением в достаточно выровненный раздел данных, но это не так. Это может быть ошибкой в ​​этой (старой) версии GCC или, возможно, проблемой, связанной с компоновщиком, где-то еще.

1 голос
/ 29 ноября 2011

Я также использую gcc (GCC) 4.1.2 20070115 (SUSE Linux), вот сгенерированная сборка:

Dump of assembler code for function is_within_range:
0x0000000000400580 <is_within_range+0>: divsd  %xmm1,%xmm0
0x0000000000400584 <is_within_range+4>: sub    $0x8,%rsp
0x0000000000400588 <is_within_range+8>: movsd  %xmm2,(%rsp)
0x000000000040058d <is_within_range+13>:        callq  0x400498 <log@plt>
0x0000000000400592 <is_within_range+18>:        andpd  358(%rip),%xmm0        # 0x400700
0x000000000040059a <is_within_range+26>:        xor    %eax,%eax
0x000000000040059c <is_within_range+28>:        movsd  (%rsp),%xmm1
0x00000000004005a1 <is_within_range+33>:        ucomisd %xmm0,%xmm1
0x00000000004005a5 <is_within_range+37>:        seta   %al
0x00000000004005a8 <is_within_range+40>:        add    $0x8,%rsp
0x00000000004005ac <is_within_range+44>:        retq

Кажется, что это почти то же самое, но у меня не происходит сбой.Я думаю, что вам нужно будет предоставить нам флаги вашего компилятора, а также информацию о вашем процессоре и версии GLIBC, а также значения a, b и range, которые вылетят для вас, поскольку проблема почти навернякас log звонком.

1 голос
/ 29 ноября 2011

Кажется, что происходит сбой после вызова функции log:

callq  0x60f098 <log@plt>

Так что может быть проблема с реализацией fabs, использующей -O0.

Вы пробовали:

double logRatio = log(ratio);
logRatio = fabs(logRatio);

Это может привести к другому выводу сборки, и вы можете получить дополнительную информацию о сбое.

В качестве альтернативы вы можете заменить вызов fabs на что-то вроде:

double logRatio = log(ratio);
logRatio = (logRatio < 0) -logRatio : logRatio;

У вас могут быть проблемы с точностью, но суть здесь не в этом ...

...