SSE загружает целые в __m128 - PullRequest
3 голосов
/ 25 февраля 2012

Каковы особенности gcc для загрузки 4 ints в __m128 и 8 дюймов в __m256 (выровненный / не выровненный)?А как насчет unsigned ints?

1 Ответ

8 голосов
/ 25 февраля 2012

Используя Intel SSE intrnisics, вы ищете:

  • _mm_load_si128()
  • _mm_loadu_si128()
  • _mm256_load_si256()
  • _mm256_loadu_si256()

Документация:

Нет различия между подписанным или неподписанным. Вам нужно будет навести указатель на __m128i* или __m256i*.


Обратите внимание, что это встроенные функции Intel SSE, и они будут работать в GCC, Clang, MSVC и ICC.
Встроенные функции GCC работают только в GCC AFAIK.

...