Question

Рассмотрим программу на C ниже.

#include <stdio.h>
#include <stdlib.h>

int main(int argc, char* argv[]) {
    double x = 4.5;
    double x2 = atof("3.5");
    printf("%.6f\n", x);
    printf("%.6f\n", x2);
    return 0;
}

При компиляции с версией GCC, доступной через MSYS2, вывод заканчивается в зависимости от доступности SSE:

$ gcc test.c && ./a.exe
4.500000
3.500000

$ gcc -mno-sse test.c && ./a.exe
4.500000
0.000000

Имеет ли это поведение какой-то смысл, и если нет, есть ли способ заставить GCC дать ощутимые результаты в этом случае (за исключением тривиального решения простого удаления -mno-sse)?Вот некоторая информация о версии:

$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-pc-msys/7.3.0/lto-wrapper.exe
Target: x86_64-pc-msys
Configured with: /msys_scripts/gcc/src/gcc-7.3.0/configure --build=x86_64-pc-msys --prefix=/usr --libexecdir=/usr/lib --
enable-bootstrap --enable-shared --enable-shared-libgcc --enable-static --enable-version-specific-runtime-libs --with-ar
ch=x86-64 --with-tune=generic --disable-multilib --enable-__cxa_atexit --with-dwarf2 --enable-languages=c,c++,fortran,lt
o --enable-graphite --enable-threads=posix --enable-libatomic --enable-libcilkrts --enable-libgomp --enable-libitm --ena
ble-libquadmath --enable-libquadmath-support --disable-libssp --disable-win32-registry --disable-symvers --with-gnu-ld -
-with-gnu-as --disable-isl-version-check --enable-checking=release --without-libiconv-prefix --without-libintl-prefix --
with-system-zlib --enable-linker-build-id --with-default-libstdcxx-abi=gcc4-compatible
Thread model: posix
gcc version 7.3.0 (GCC)

А вот результат дизассемблирования main:

   0x0000000100401080 <+0>:     push   %rbp
   0x0000000100401081 <+1>:     mov    %rsp,%rbp
   0x0000000100401084 <+4>:     sub    $0x30,%rsp
   0x0000000100401088 <+8>:     mov    %ecx,0x10(%rbp)
   0x000000010040108b <+11>:    mov    %rdx,0x18(%rbp)
   0x000000010040108f <+15>:    callq  0x1004010f0 <__main>
   0x0000000100401094 <+20>:    fldl   0x1f76(%rip)        # 0x100403010
   0x000000010040109a <+26>:    fstpl  -0x8(%rbp)
   0x000000010040109d <+29>:    lea    0x1f5c(%rip),%rcx        # 0x100403000
   0x00000001004010a4 <+36>:    callq  0x100401100 <atof>
   0x00000001004010a9 <+41>:    mov    %rax,-0x10(%rbp)
   0x00000001004010ad <+45>:    mov    -0x8(%rbp),%rax
   0x00000001004010b1 <+49>:    mov    %rax,%rdx
   0x00000001004010b4 <+52>:    lea    0x1f49(%rip),%rcx        # 0x100403004
   0x00000001004010bb <+59>:    callq  0x100401110 <printf>
   0x00000001004010c0 <+64>:    mov    -0x10(%rbp),%rax
   0x00000001004010c4 <+68>:    mov    %rax,%rdx
   0x00000001004010c7 <+71>:    lea    0x1f36(%rip),%rcx        # 0x100403004
   0x00000001004010ce <+78>:    callq  0x100401110 <printf>
   0x00000001004010d3 <+83>:    mov    $0x0,%eax
   0x00000001004010d8 <+88>:    add    $0x30,%rsp
   0x00000001004010dc <+92>:    pop    %rbp
   0x00000001004010dd <+93>:    retq
   0x00000001004010de <+94>:    nop
   0x00000001004010df <+95>:    nop

Примечательно, что попытка скомпилировать ту же программу на Linux-версии GCC приводит к ошибкевместо этого (по причинам, обсуждаемым в этот вопрос ):

$ gcc -mno-sse test2.c
test2.c: In function ‘main’:
test2.c:6:12: error: SSE register return with SSE disabled
     double x2 = atof("3.5");
            ^~

$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/6/lto-wrapper
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Debian 6.3.0-18+deb9u1' --with-bugurl=file:///usr/share/doc/gcc-
6/README.Bugs --enable-languages=c,ada,c++,java,go,d,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-6 --program-pr
efix=x86_64-linux-gnu- --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enabl
e-threads=posix --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-l
ibstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-gnu-unique-object --disable-vtable-verify --enable-libmpx --
enable-plugin --enable-default-pie --with-system-zlib --disable-browser-plugin --enable-java-awt=gtk --enable-gtk-cairo
--with-java-home=/usr/lib/jvm/java-1.5.0-gcj-6-amd64/jre --enable-java-home --with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-
gcj-6-amd64 --with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-6-amd64 --with-arch-directory=amd64 --with-ecj-jar=/u
sr/share/java/eclipse-ecj.jar --with-target-system-zlib --enable-objc-gc=auto --enable-multiarch --with-arch-32=i686 --w
ith-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-checking=release --build=x8
6_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 6.3.0 20170516 (Debian 6.3.0-18+deb9u1)

Peter Cordes · Answer 1 · 04 октября 2018

вы должны получить ту же ошибку от msys gcc -mno-sse.Стандартное соглашение о вызовах (x64 Windows __fastcall) использует xmm0..3 (векторные регистры SSE) для передачи и возврата float и double.

Из отображаемого asm main он отображаетсячто -mno-sse меняет представление gcc о соглашении о вызовах на передачу / возврат double в целочисленных регистрах, как soft-float в ARM.Таким образом, существует несоответствие соглашения о вызовах, и то, что фактически произошло, связано с деталями и шансами asm.

Соглашение о вызовах в Windows x64 имеет интересную конструктивную особенность, которая делает реализацию функций с переменными числами, таких как printf проще:* при вызове функции с переменными числами регистры как целого числа, так и XMM для этого слота должны содержать значение (https://docs.microsoft.com/en-gb/cpp/build/varargs?view=vs-2017).). Таким образом, функция может выгружать rcx, rdx, r8 и r9 в теневое пространство и формировать массивиз 8-байтовых аргументов (смежных с аргументами стека), прежде чем смотреть на аргументы, чтобы выяснить, какие из них являются FP, а какие целыми (см. Как установить аргументы функции в сборке во время выполнения в 64-битном приложении в Windows? для уродливого примера этого.) В отличие от x86-64 System V ABI, 2-й аргумент целиком относится к XMM1, а не к 2-му FP аргументу. Таким образом, всего 4 аргумента могут быть вregs, даже если есть сочетание FP и целого числа.

Таким образом, передача gcc double битового шаблона в %rdx actually работает , потому что эта библиотека printf заботится только о значении в %rdx, игнорируя значение в %xmm1.

Но atof возвращается в XMM0, а RAX содержит мусор.Ваш -mno-sse main использует функцию сохранения RAX и передает ее во 2-й тип печати.Это либо ноль, либо очень маленький double.

Если RAX хранит адрес, старшие 16 бит будут равны нулю, поэтому введите этот битовый шаблон в IEEE double (https://en.wikipedia.org/wiki/Double-precision_floating-point_format) дает нам экспоненту = 0, а также некоторые биты значимого. Маленькое положительное целое число будет еще меньше double.

Так что вы, вероятно, напечатали очень маленькое субнормальное double округляется до 0 в том формате, который получен из любого мусора atof, оставленного в RAX, когда он возвращает значение в XMM0.

MSYS2 GCC обнуляется вдвое при операциях с плавающей запятой с отключенным SSE

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

MSYS2 GCC обнуляется вдвое при операциях с плавающей запятой с отключенным SSE

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы