У меня есть приложение Delphi 6, которое изменяет растровые изображения в режиме реального времени
Я сделал функцию для постеризации изображений. // =( #define ARGB_COLOR(a, r, g, b) (((a) <<...
Я хочу добавить четыре компонента регистра SSE, чтобы получить один float.Вот как я это делаю...
Я хочу улучшить следующий код, вычисляя среднее значение: void calculateMeanStDev8x8Aux(cv::Mat*...
В SSE3 инструкция PALIGNR выполняет следующее: PALIGNR объединяет операнд назначения (первый...
Мне нужно улучшить цикл, потому что он вызывается моим приложением тысячи раз. Полагаю, мне нужно...
У меня есть следующий тип кода short v[8] __attribute__ (( aligned(16))); ... // in an inlined...
Я пытаюсь оптимизировать эту функцию с помощью SIMD, но я не знаю, с чего начать. long sum(int x...
Я хочу умножить данные, хранящиеся в одном регистре xmm, на одно значение с плавающей точкой и...
Я использую инструкцию VPADAL.U32, чтобы значительно увеличить скорость кода добавления.Тем не...
Есть ли способ "векторизовать" добавление элементов в массивы SIMD-модой? Например, я бы хотел...
Я хочу умножить на SSE4 объект __m128i с 16 беззнаковыми 8-битными целыми числами, но я смог найти...
У меня есть два массива, и я хочу получить точечный продукт. Как мне получить значения vek и vec в...
Пытаясь оценить выигрыш в производительности от встроенной архитектуры, я пытался найти число...
Мой код сильно зависит от вычисления расстояния между двумя точками в трехмерном пространстве....
Мне было интересно сделать проект о распознавании лиц (чтобы использовать набор инструкций SIMD).Но...
Я очень тупой. Когда я запускаю этот код в Visual C ++ 2008: __m128i a, b; a.m128i_u64[0] = 1; b
Я использую встроенные функции SSE2 для оптимизации узких мест моего приложения, и у меня возникает...
Как проверить, имеет ли переменная __m128i ненулевое значение на процессорах SSE-2 и более ранних...
У меня много (x1, y1, z1), (x2, y2, z2), (x3, y3, z3) векторных триплетов одинарной точности, и я...
В своем стремлении изучить ассемблер (используя GCC на x86_64) я натолкнулся на несколько примеров...
Допустим, у меня есть массив k = [1 2 0 0 5 4 0] Я могу вычислить маску следующим образом m = k...
Я некоторое время боролся с производительностью сетевого кодирования в разрабатываемом приложении...
Обновление: пожалуйста, прочитайте код, речь не идет о подсчете битов в одном целом Можно ли...
В настоящее время я разрабатываю OpenCL-приложение для очень разнородного набора компьютеров (в...