Мы используем библиотеки libjpeg_turbo и livpx C ++ в нашем приложении Android ndk (используя...
У меня есть массив с коротким знаком, который я хочу разделить на 2048, и в результате получить...
У меня проблемы с пониманием определенного фрагмента кода в сборке.Задача состоит в том, чтобы...
Я хотел бы реализовать numpy.triu_indices (a, 1) (обратите внимание, что вторым аргументом является...
У меня уже есть SIMD сравниваемый регистр __m128i, что приводит к чему-то вроде: 0, 0, -1, -1, 0, 0...
Имеется сверточное ядро 3x3 и изображение, представленное массивом пикселей целых значений....
У меня есть процедура, где следует проверить, является ли число с плавающей запятой меньше нуля или...
Я хочу сдвинуть вправо каждый элемент регистра __m128i на другую величину. Я знаю, что это возможно...
Я новичок в программировании AVX. У меня есть регистр, который нужно перемешать. Я хочу переместить...
Я использую следующее для извлечения знакового бита __mm128: const int sign_mask =...
Я разрабатываю серию векторных классов в C ++, которые поддерживают SSE (SIMD). Операторы были...
Этот вопрос относится к ранее отвеченному вопросу: Быстрый 24-битный массив -> 32-битное...
Вот два разных способа, которыми я мог бы сделать сдвиг влево на> = 64 бита с помощью встроенных...
Встроенный _mm_slli_si128 будет выполнять логический сдвиг влево от 128-битного регистра, но...
Благодаря встроенным функциям компилятора Intel с 128-битным регистром, упаковывающим 8 16-битных...
Я только начал использовать SSE, и меня смущает, как получить максимальное целое значение (max) из...
Мне нужно прочитать / записать 16 байтов атомарно. Я пишу только с помощью cmpxchg16, который...
В Visual Studio 2010, когда я включаю расширенные наборы инструкций для следующего кода, время...
Я пытаюсь достичь пиковой производительности однопоточного FP для моего процессора nehalem, чтобы...
Я пишу компилятор, и мне нужно вывести код для условий ветвления для значений с плавающей запятой....
У меня проблема с SLMATH библиотекой .Не уверен, если кто-то использует это или использовал это...
У меня есть вопрос о пиковой производительности FP моего ядра i7 920. У меня есть приложение,...
Я пытаюсь реализовать символьно-частотную функцию в C. Конечно, эта задача очень проста, просто...
Я пытаюсь восстановить инженерный код, но эту часть сборки я не могу понять.Я знаю, что это часть...
Я пишу программный растеризатор с использованием MSVC ++ Express 2010 для Windows.Я использую SSE и...