Суммируйте массив беззнаковых 8-битных целых чисел, используя платформу Accelerate - PullRequest
3 голосов
/ 06 апреля 2011

Могу ли я использовать Accelerate Framework для суммирования массива 8-битных целых без знака без преобразования в массив с плавающей точкой.

Мой текущий подход:

vDSP_vfltu8(intArray, 1, floatArray, 1, size);
vDSP_sve(floatArray, 1, &result, size);

Но vDSP_vfltu8 довольно медленный.

1 Ответ

1 голос
/ 12 апреля 2011
  1. Если для вас важно, чтобы vDSP_vfltu8( ) был быстрым, отправьте отчет об ошибке .Если есть какие-либо вопросы, подайте отчет об ошибке .Неадекватная производительность является ошибкой и будет считаться таковой, если вы сообщите об этом.Авторы библиотек используют такую ​​обратную связь, чтобы определить, как расставить приоритеты в своей работе;Ваш отчет об ошибке - это разница между функцией, находящейся в начале очереди для оптимизации, и номером # 1937 в очереди.
  2. Как уже указывалось, накопление целых чисел осложняется проблемами переполнения, но еслибыло бы полезно иметь оптимизированную функцию для конкретного случая, предоставляемую библиотекой vDSP, пожалуйста, подайте отчет об ошибке , чтобы запросить такую ​​функцию (замечая образец?).Авторы библиотек не экстрасенсы и не пишут функции, которые не запрашиваются.Обязательно объясните, как вы будете использовать такую ​​функцию - учитывая эту информацию, они могут придумать немного другую функцию, которая будет еще более полезна для вас.
  3. Если вы решите написать некоторый код NEON самостоятельно,вы захотите использовать встроенную vaddw_u8( ).
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...