Пытаясь пройти курс на Coursera , я попытался оптимизировать пример кода C ++ для моего Intel...
Я пробую векторную инструкцию, используя библиотеки "vcl" и "ume" для своего рода сортировки,...
Могу ли я заставить компилятор компилировать некоторые встроенные функции вне установки -march в...
По сути, я хочу выполнить маску AND над массивом байтов.Я знаю, что код будет выглядеть примерно...
Есть ли способ получить длину строки ASCII, которая хранится в 16- или 32-байтовом буфере, загрузив...
Я разработал игру, в которой периодически добавляются векторы друг к другу. Например: position +=...
Я знаю, как проверить, все ли регистры _m128i равны нулю с присущей _mm_test_all_zeros. Какая...
Представьте, что у меня есть эта наивная функция для обнаружения перекрытия сфер.Смысл этого...
Я хотел запустить какой-то код через анализатор IACA, чтобы увидеть, сколько мопов он использовал -...
Мне нужно выполнить битовое сканирование в обратном порядке с помощью LZCNT массива слов: 16 битов....
Я пытаюсь оптимизировать следующее sum{vec4[indexarray[i]] * scalar[i]}, где vec4 - это float[4], а...
Я пытаюсь создать простую программу, которая использует технологию Intel AVX и выполняет умножение...
Когда я проверяю номер цикла модуля, результаты каждого теста совершенно разные? 1781344-->First...
Мне нужно оптимизировать следующую операцию сжатия (на сервере с доступными инструкциями AVX2):...
Я пытаюсь выяснить, как транспонировать (во встроенных функциях AVX2) прямоугольную матрицу,...
В настоящее время я занимаюсь рефакторингом императивной программы на C ++, которая широко...
У меня есть приложение, которое требует, чтобы AVX2 работал правильно.Была реализована проверка для...
Следующая функция, кажется, недоступна на AVX512: __m512i _mm512_sign_epi16 (__m512i a, __m512i b)...
Меня интересуют рабочие характеристики следующих встроенных функций / инструкций:...
Я пытаюсь увеличить пропускную способность хеша md5 с помощью AVX2. Я использовал библиотеку...
Мы должны выполнить побитовую операцию XOR для двух массивов, каждый из которых содержит 5...
В Xcode (Версия 10.1 (10B61)) я использовал макрос, как показано ниже, для определения поддержки...
, как говорится в вопросе, у меня есть обычный int, который состоит из 8 упакованных значений по 4...
Я недавно изучал FP и AVX и в Википедии (https://en.wikipedia
Я использую _mm256_cvtps_epi32() для преобразования из 8 float с в 8x32-битные целые числа.Но цель...