ipad2 неоновая скорость с плавающей запятой по сравнению с ipad1 - PullRequest
0 голосов
/ 21 июня 2011

При тестировании инструкций NEON на ipad1 и ipad2 я почти не замечаю ускорения в коде на ipad2, где большинство функций на ipad2 работают намного быстрее, чем на ipad1.

Это для таких инструкций, как VMUL, VLD1, VADD, VSUB и т. Д., Использующих регистры четырехзначных слов, таких как q0, для таких вещей, как FFT.

Кроме того, я замечаю, что собственная функция FFT для яблок vdsp_fft_zrip не ускоряется и для ipad2.

Итак, вопрос в том, работает ли ipad2 NEON быстрее, чем движок ipad1 NEON для инструкций типа quad word SIMD?

Ответы [ 2 ]

1 голос
/ 04 ноября 2011

Устройство NEON на A4 было необычайно мощным по сравнению с остальной частью ядра.Остальная часть ядра на A5 значительно улучшена по сравнению с A4, но производительность устройства NEON более или менее неизменна.Ожидается то, что вы наблюдаете.

Конечно, теперь есть два ядра, поэтому, если вы сможете воспользоваться обоими, вы все равно сможете увидеть значительное ускорение.Кроме того, вычисления с двойной точностью на A5 значительно улучшены по сравнению с A4, поскольку теперь они полностью конвейерны.

0 голосов
/ 02 ноября 2011

NEON будет оставаться неизменным в течение долгого времени, даже на недавно представленной 64-битной ARM.

NEON не сильно выигрывает от увеличенной тактовой частоты.NEON уже настолько быстр, что тратит большую часть времени выполнения функции на ожидание данных из памяти.

...