У меня есть большой кусок кода, часть тела которого содержит этот кусок кода: result = (nx * m_Lx +...
Справочная информация : у меня есть подпрограмма C99, для которой требуется временное хранение...
Я оцениваю OpenCL для своих целей.Мне пришло в голову, что вы не можете предполагать, что он...
В "gcc версии 4.2.1 (на основе Apple Inc., сборка 5658) (сборка LLVM 2335.15.00)" в массиве tr1 я...
Кажущаяся тривиальная проблема в сборке: я хочу скопировать весь регистр XMM0 в XMM3 Я пробовал...
Глядя на операторов SSE CMPORDPS - ordered compare packed singles CMPUNORDPS - unordered compare...
Я сделал функцию для постеризации изображений. // =( #define ARGB_COLOR(a, r, g, b) (((a) <<...
Я хочу добавить четыре компонента регистра SSE, чтобы получить один float.Вот как я это делаю...
Я пытаюсь использовать __m128i в качестве типа значения вектора с выравниванием по кэшу в GCC, и я...
Я пытаюсь избавиться от невыровненных загрузок и хранилищ для инструкций SSE для моего приложения,...
Это совмещение по предыдущему вопросу , который у меня был относительно разнесения отдельных...
Я пишу код с использованием встроенных функций C для инструкций Intel AVX. Если у меня есть...
Как создать маску с использованием встроенных функций SSE, которые указывают, одинаковы ли знаки...
У меня есть следующий тип кода short v[8] __attribute__ (( aligned(16))); ... // in an inlined...
В моем коде есть несколько вложенных циклов for, и я пытаюсь использовать инструкции Intel SSE на...
Я пытаюсь оптимизировать эту функцию с помощью SIMD, но я не знаю, с чего начать. long sum(int x...
typedef float v4sf __attribute__ ((mode(V4SF))); Это в GCC.Кто-нибудь знает синтаксис...
Моя первоначальная попытка выглядела так (предполагается, что мы хотим умножить) __m128 mat[n]; /*...
Я пытаюсь оптимизировать функцию куба, используя SSE long cube(long n) { return n*n*n; } Я пробовал...
Извините, у меня нет хорошего заголовка ... Я читал эту тему: Умножение векторной матрицы в SSE...
Я хочу умножить на SSE4 объект __m128i с 16 беззнаковыми 8-битными целыми числами, но я смог найти...
У меня есть два массива, и я хочу получить точечный продукт. Как мне получить значения vek и vec в...
У меня есть программа на C ++, которая компилируется в gcc (gcc версии 4.5.1) с флагом -O3. Я думаю...
Я только начал использовать SSE для оптимизации своего кода для проекта компьютерного зрения с...
Вот моя проблема: у нас есть математическая библиотека, написанная на C ++, которая интенсивно...