Для краткого урока истории вы можете ознакомиться с Примером с плавающей запятой Intel .
Компиляторы Intel имеют опцию, которая по умолчанию включена при оптимизации и включает так называемые функция быстрой математики .Это делает математику намного быстрее, но снижает строгое соответствие стандартам IEEE.Можно обеспечить строгое соответствие стандартам с опцией fp-model .
Я считаю, что язык CUDA для графических процессоров NVidia также имеет значительно более быструю математическую библиотеку, если кто-то готов отказаться от строгого соответствия стандарту IEEE.Это не только ускоряет математику, но и уменьшает количество регистров, используемых, в частности, для трансцендентных функций.
Необходимость соблюдения зависит от каждого конкретного случая.У нас возникли проблемы с оптимизацией Intel, и нам пришлось включить опцию fp-model strict
, чтобы обеспечить правильные результаты с математикой двойной точности.