Вопросы с тегом SIMD - PullRequest

Вопросы с тегом SIMD

10 голосов
4 ответов

Я пытаюсь умножить два вектора вместе, где каждый элемент одного вектора умножается на элемент в...

Sam / 08 ноября 2010
43 голосов
4 ответов

В процессоре ARM Cortex-A8 я понимаю, что такое NEON, это SIMD сопроцессор. Но работает ли модуль...

HaggarTheHorrible / 04 ноября 2010
2 голосов
4 ответов

Я хочу оптимизировать следующую функцию с использованием SIMD (SSE2 и т. Д.): int64_t fun(int64_t N...

Eugene Smith / 29 октября 2010
7 голосов
3 ответов

Я работаю в Visual Studio 2008, и в настройках проекта я вижу опцию «Активировать расширенный набор...

Mat / 26 октября 2010
0 голосов
4 ответов

Я использую процессор Intel Core2Duo E4500. Предполагается иметь средства SSE3, SSSE3. Но если я...

anup / 25 октября 2010
4 голосов
2 ответов

Я использую SIMD для вычисления быстрого возведения в степень. Я сравниваю время с кодом не-simd....

anup / 25 октября 2010
4 голосов
2 ответов

Я чувствую потребность в скорости. Двойная петля убивает мою производительность приложений iPad....

dugla / 02 октября 2010
5 голосов
3 ответов

Я хотел бы оптимизировать следующий фрагмент, используя инструкции SSE, если это возможно: /* * the...

guest / 30 сентября 2010
4 голосов
1 ответ

Как вообще использовать инструкции сравнения NEON? Вот случай, который я хочу использовать,...

HaggarTheHorrible / 24 сентября 2010
1 голос
3 ответов

Я использую расширения SSE, доступные в процессоре Core2Duo (компилятор gcc 4.4.1).Я вижу, что...

anup / 11 сентября 2010
2 голосов
1 ответ

(Извините, если это звучит как напыщенная речь, но это настоящий вопрос, и я был бы признателен за...

luiscubal / 06 сентября 2010
5 голосов
5 ответов

Мне нужно оптимизировать некоторый C-код, который выполняет много физических вычислений, используя...

Open the way / 05 сентября 2010
3 голосов
2 ответов

У меня есть код: float *mu_x_ptr; __m128 *tmp; __m128 *mm_mu_x; mu_x_ptr =...

martiert / 03 августа 2010
13 голосов
3 ответов

Я ищу наиболее эффективный способ перевернуть знак на всех четырех поплавках, упакованных в регистр...

nsanders / 29 июля 2010
2 голосов
2 ответов

Многие инструкции SSE позволяют исходному операнду быть 16-байтовым выровненным адресом памяти....

dietr / 29 июля 2010
4 голосов
1 ответ

У меня есть A = a1 a2 a3 a4 b1 b2 b3 b4 c1 c2 c3 c4 d1 d2 d3 d4 У меня есть 2 строки со мной,...

HaggarTheHorrible / 27 июля 2010
5 голосов
3 ответов

Я использую процессор на базе ARM Cortex-A8, и у меня есть несколько мест, где я вычисляю обратные...

HaggarTheHorrible / 26 июля 2010
6 голосов
5 ответов

У меня есть некоторый код, который работает довольно хорошо, но я бы хотел, чтобы он работал лучше

zebediah49 / 18 июля 2010
5 голосов
2 ответов

У меня есть алгоритм обработки изображений, который состоит из матриц, у меня есть собственные коды...

HaggarTheHorrible / 15 июля 2010
13 голосов
3 ответов

как использовать свойства Multiply-Accumulate, предоставляемые GCC? float32x4_t vmlaq_f32...

HaggarTheHorrible / 13 июля 2010
9 голосов
3 ответов

Полезно ли выполнять сложное умножение и деление с помощью инструкций SSE? Я знаю, что сложение и...

pv. / 09 июля 2010
7 голосов
2 ответов

Я очень новичок в SIMD / SSE и пытаюсь сделать простую фильтрацию изображений (размытие)

dietr / 28 июня 2010
2 голосов
3 ответов

Мне интересно, есть ли способ расширить тип ruby ​​Array для вычисления вектора SIMD и SSE. Я имею...

bitTnkr / 25 июня 2010
26 голосов
2 ответов

Я пишу игру на Хаскеле, и мой текущий проход в пользовательском интерфейсе включает в себя много...

Steven Robertson / 25 июня 2010
3 голосов
2 ответов

не смог найти ничего, кроме вопросов о мнении о 64/32-битном материале, когда я искал. __asm__ {...

Tom / 24 июня 2010
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...