ARM Neon: VPADAL для вычитания - PullRequest
0 голосов
/ 22 ноября 2011

Я использую инструкцию VPADAL.U32, чтобы значительно увеличить скорость кода добавления.Тем не менее, мне нужно что-то вычесть с накоплением и переносом (именно то, что я получил в качестве дополнения).

Желаемое за действительное или реально возможное?

Из того, что я могу собрать, мне нужноуменьшите мой второй операнд, затем не его биты ... выполните VPADAL, а затем выполните битовый тест для 1 и вычтите 1 из полученного переноса (чтобы получить 0 или -1 - мое накопление).

Я где-то пропускаю тайную технику?

1 Ответ

0 голосов
/ 23 ноября 2011

Вы можете использовать VPADDL для попарного суммирования добавлений и удвоения ширины, а затем использовать VQSUB, чтобы вычесть этот термин из общей суммы.

...