Это особенно относится к кодированию ARM Neon SIMD. Я использую функции ARM Neon для определенного модуля в видеодекодере. У меня есть векторизованные данные следующим образом:
В неоновом регистре есть четыре 32-битных элемента - скажем, Q0 - размером 128 бит.
3B 3A 1B 1A
В другом неоновом регистре есть еще четыре 32-битных элемента, скажем, Q1, размер которого 128 бит.
3D 3C 1D 1C
Я хочу, чтобы окончательные данные были в порядке, как показано ниже:
1D 1C 1B 1A
3D 3C 3B 3A
Какие неоновые функции могут достичь желаемого порядка данных?