Как сравнить два вектора с использованием SIMD и получить один логический результат? - PullRequest
12 голосов
/ 29 июля 2011

У меня есть два вектора по 4 целых числа в каждом, и я хотел бы использовать команду SIMD для их сравнения (скажем, создать вектор результата, где каждая запись равна 0 или 1 в соответствии с результатом сравнения).

Тогда я бы хотел сравнить вектор результата с вектором из 4 нулей, и только если они равны, что-то сделать.

Знаете ли вы, какие SIMD-команды я могу использовать для этого?

1 Ответ

15 голосов
/ 29 июля 2011

Для сравнения двух SIMD векторов:

#include <stdint.h>
#include <xmmintrin.h>

int32_t __attribute__ ((aligned(16))) vector1[4] = { 1, 2, 3, 4 };
int32_t __attribute__ ((aligned(16))) vector2[4] = { 1, 2, 2, 2 };
int32_t __attribute__ ((aligned(16))) result[4];

__m128i v1 = _mm_load_si128((__m128i *)vector1);
__m128i v2 = _mm_load_si128((__m128i *)vector2);
__m128i vcmp = _mm_cmpeq_epi32(v1, v2);
_mm_store_si128((__m128i *)result, vcmp);

Примечания:

  • данные предполагаются 32-битными целыми числами
  • vector1, vector2, result все должны быть выровнены по 16 байтов
  • результат будет равен -1 для равных, 0 для не равных ({ -1, -1, 0, 0 } для приведенного выше примера кода)

UPDATE

Если вам нужен только один логический результат для случая, когда все 4 элемента совпадают, вы можете сделать это следующим образом:

#include <stdint.h>
#include <xmmintrin.h>

int32_t __attribute__ ((aligned(16))) vector1[4] = { 1, 2, 3, 4 };
int32_t __attribute__ ((aligned(16))) vector2[4] = { 1, 2, 2, 2 };

__m128i v1 = _mm_load_si128((__m128i *)vector1);
__m128i v2 = _mm_load_si128((__m128i *)vector2);
__m128i vcmp = _mm_cmpeq_epi32(v1, v2);
uint16_t mask = _mm_movemask_epi8(vcmp);
int result = (mask == 0xffff);
...