Я чувствую потребность в скорости. Двойная петля убивает мою производительность приложений iPad. Мне нужно SIMD. Как выполнить целочисленные операции SIMD на процессоре iPad A4?
Спасибо Дуг
Набор инструкций: NEON, Внутренняя ссылка
Мне никогда не удавалось найти хорошую документацию о том, чем они все являются на самом деле. Но вы подхватываете это довольно быстро, если у вас было какое-либо воздействие SSE
Чтобы получить максимальную скорость, вам нужно будет написать код на языке ARM Assembly, который использует операции NEON SIMD, потому что компиляторы C обычно не создают очень хороший код SIMD, поэтому рукописная сборка будет иметь большое значение. У меня есть краткое вступление: http://www.shervinemami.co.cc/iphoneAssembly.html
Обратите внимание, что iPad A4 использует процессор ARMv7-A, поэтому справочное руководство для инструкций NEON SIMD: http://infocenter.arm.com/help/topic/com.arm.doc.ddi0406b/index.html (но его длина 2000 страниц и требует понимания кода сборки и, возможно, SIMD в целом!).