Компилятор Apple LLVM 3.0 автоматически приведёт к двойному числу - PullRequest
4 голосов
/ 26 декабря 2011

Часть кода:

*det_ptr++ = (float)(dx*dy - 0.81*dxy*dxy);

, где dx, dy и dxy - числа с плавающей точкой.

Компилятор Apple LLVM 3.0 выполняет следующую сборку дляit:

+0x250  vldr.32                        s0, [r13, #+140]
+0x254  vldr.32                        s1, [r13, #+136]
+0x258  vmul.f32                       s0, s0, s1
+0x25c  vcvt.f64.f32                   d16, s0 <-------------- cast from float to double
+0x260  vldr.32                        s0, [r13, #+132]
+0x264  vcvt.f64.f32                   d17, s0 <-------------- cast from float to double
+0x268  vldr.64                        d18, [r13, #+16]
+0x26c  vmul.f64                       d17, d18, d17
+0x270  vldr.32                        s0, [r13, #+132]
+0x274  vcvt.f64.f32                   d19, s0 <-------------- cast from float to double
+0x278  vmul.f64                       d17, d17, d19
+0x27c  vsub.f64                       d16, d16, d17
+0x280  vcvt.f32.f64                   s0, d16
+0x284  ldr                            r0, [sp, #+104]
+0x286  adds                           r1, r0, #4  ; 0x4
+0x288  str                            r1, [sp, #+104]
+0x28a  vstr.32                        s0, [r0]

Есть ли способ запретить эти приведения?

1 Ответ

10 голосов
/ 26 декабря 2011

Способ написания вашей программы требует этих приведений. 0.81 является литералом двойной точности, поэтому dxy должен быть увеличен до удвоения, прежде чем произойдет умножение, и dx*dy должен быть повышен до вычитания. Тот факт, что вы приводите окончательный результат к плавающему значению, не имеет значения - стандарт C совершенно ясно, что эти термины оцениваются с двойной точностью независимо

Чтобы не допустить удвоения повышения, вместо этого используйте литерал одинарной точности (добавив суффикс f):

*det_ptr++ = dx*dy - 0.81f*dxy*dxy;
...