Рассмотрим простую функцию: #include <math.h> void ahoj(float *a) { for (int i=0; i<256;...
У меня есть два вектора __m256i, заполненные 32 8-битными целыми числами.Примерно так: __int8 *a0 =...
Я пытаюсь сравнить два __m256i (4 упакованных 64-разрядных целых числа). Для этого я использую...
Я хочу преобразовать 8-битное целое число в массив размера 8, каждое значение которого содержит...
У меня есть случай использования, где у меня есть массив битов, каждый бит представлен как 8-битное...
У меня есть тривиальный цикл, который я ожидаю увидеть регистры YMM в сборке, но вижу только XMM...
Я пишу программу для определения чисел простых чисел. Одна часть - это отсеивание возможных...
Я написал программу продукта Matrix-Vector с использованием OpenMP и AVX2. Однако я получил...
Недавно я обнаружил, что у AVX2 нет поп-счета для __m256i, и единственный способ сделать что-то...
Я скомпилировал свою программу на С ++ на машине, которая поддерживает avx2 (Intel E5-2643 V3). Он...
У нас есть модуль перевода, который мы хотим скомпилировать с AVX2 (только этот): Это говорит GCC...
У меня есть массив с коротким знаком, который я хочу разделить на 2048, и в результате получить...
Я хочу ускорить следующую операцию с инструкциями AVX2, но мне не удалось найти способ сделать это....
Существует два способа приведения в AVX2: __m256i b = ...set register... auto c = (__m256d)b; //...
У меня длинный кусок памяти, скажем, 256 КиБ или больше. Я хочу подсчитать количество 1 битов во...
У меня есть вектор __m256d, упакованный четырьмя 64-битными значениями с плавающей точкой. Мне...
В SSE3 инструкция PALIGNR выполняет следующее: PALIGNR объединяет операнд назначения (первый...