При работе с целыми числами и числами в SSE (AVX) целесообразно ли преобразовывать все числа в...
Каковы особенности gcc для загрузки 4 ints в __m128 и 8 дюймов в __m256 (выровненный / не...
Мне нужна функция переменной __m128i с периодом 2 ^ 128. Не нужно монотонно увеличивать (например,...
Я пытаюсь построить слегка модифицированные версии некоторых функций библиотеки CRT VS2010, все...
Какое имя gcc присуще для сравнения __m256 и __m256i (набор инструкций AVX)?
Я пытаюсь ускорить некоторый код, используя автоматическую векторизацию из компилятора Intel и...
Предположим, у меня есть два вектора, представленные двумя массивами типа double, каждый размером 2
Я рассматриваю возможность использования SSE для ускорения кода в моем проекте.Это обычно требует...
Я хочу преобразовать массив беззнаковых коротких чисел в плавающее с использованием SSE.Допустим,...
Это дополнительный вопрос к , этот .Теперь я хотел бы конвертировать в обратном направлении float...
x86 не имеет инструкции SSE для преобразования из unsigned int32 в число с плавающей запятой. Какая...
Обычная операция, которую я выполняю в своей программе, - это масштабирование векторов скаляром (V...
Подпрограммы strcmp для сравнения char * и memcmp для всего остального, работают ли они быстрее на...
Я пытаюсь оптимизировать вычислительно-интенсивный алгоритм и застрял в какой-то проблеме с кешем.У...
Как правильно преобразовать значение __int64 в значение __m64 для использования с SSE?
У меня проблема с методом SSE, который я пишу, который выполняет обработку звука.Я реализовал...
Мне было поручено написать программу, которая выполняет потоковую передачу векторов в разбросанные...
Я попытался смешать встроенные функции SSE2 и встроенный ассемблер в gcc.Но если я указываю...
Я пытался оптимизировать некоторый код, который обрабатывает необработанные данные пикселей. В...
Я давно использую встроенные функции Intel SSE с хорошим приростом производительности.Следовательно...
Я делаю некоторые статистические расчеты.Мне нужно, чтобы они были быстрыми, поэтому я переписал...
Я все еще работаю над подпрограммами для произвольных длинных целых чисел в C ++.До сих пор я...
Я пытаюсь переписать некоторый код, чтобы использовать SSE.Однако по какой-то причине моя версия...
Я скомпилировал приведенный ниже код с помощью компилятора VC ++ 2010: __declspec(dllexport)...
В чем разница между следующими двумя строками? __m128 x = _mm_load_ps((float *) ptr); __m128 y =...