Вопросы с тегом sse - PullRequest

Вопросы с тегом sse

5 голосов
3 ответов

Моя (simd) реализация занимает различное количество времени, хотя она запускается для...

anup / 30 января 2011
3 голосов
1 ответ

У меня есть алгоритм, который выигрывает от оптимизации рук с использованием встроенных функций SSE...

Freddie Witherden / 25 января 2011
3 голосов
1 ответ

В проекте, над которым я сейчас работаю, мне часто нужно найти минимально возможный индекс в...

fokenrute / 22 января 2011
11 голосов
3 ответов

Привет.Я пытаюсь аппроксимировать функцию Log10 [x ^ k0 + k1], где .21

Yale Zhang / 16 января 2011
5 голосов
1 ответ

Я вижу код, показанный ниже: #include "stdio.h" #define VECTOR_SIZE 4 typedef float v4sf...

goldenmean / 04 января 2011
0 голосов
2 ответов

Что такое простой эквивалентный код C для преодоления __ функций, таких как _mm_store_ps,...

kamakshi / 29 декабря 2010
0 голосов
2 ответов

Возможно ли получить доступ к одному байту в регистре mmx, например, к массиву? У меня есть этот...

Pepeluis / 21 декабря 2010
12 голосов
1 ответ

Предположим, у меня есть массив: uint8_t arr[256]; и элемент __m128i x , содержащий 16 байтов, x_1,...

Travis / 19 декабря 2010
0 голосов
4 ответов

Я работаю над обнаружением лица, в котором я принимаю ввод в виде файла .bmp, определяю лицо и...

kamakshi / 17 декабря 2010
3 голосов
4 ответов

int u1, u2; unsigned long elm1[20], _mulpre[16][20], res1[40], res2[40]; 64 bits long res1, res2...

anup / 15 декабря 2010
10 голосов
5 ответов

Мне нужна реализация функции журнала с открытым исходным кодом (без ограничений по лицензии),...

watson1180 / 13 декабря 2010
3 голосов
1 ответ

Два связанных вопроса. Это то, что мой код должен делать с довольно большим объемом данных. Это...

watson1180 / 13 декабря 2010
12 голосов
2 ответов

Передача выровненных типов или структур с выровненными типами по значению не работает с некоторыми...

watson1180 / 13 декабря 2010
2 голосов
1 ответ

Например, если вы используете -msse4, означает ли это, что он также будет использовать -mssse3,...

arsenm / 09 декабря 2010
0 голосов
2 ответов

Следующий цикл выполняется сотни раз. elma and elmc are both unsigned long (64-bit) arrays, so is...

anup / 09 декабря 2010
4 голосов
4 ответов

elma и elmc являются массивами unsigned long.Так же как и res1 и res2. unsigned long simdstore[2];...

anup / 09 декабря 2010
1 голос
1 ответ

Я использую следующее объявление объединения в SSE2. typedef unsigned long uli; typedef uli v4si...

anup / 08 декабря 2010
7 голосов
2 ответов

Я пытаюсь оптимизировать свой код с помощью встроенных функций SSE, но сталкиваюсь с проблемой,...

Kaigi / 05 декабря 2010
0 голосов
1 ответ

Я пытаюсь понять, как работает сдвиг с SSE, но я не понимаю, что вывод GDB дает мне. Используя SSE4...

Nils / 14 ноября 2010
11 голосов
4 ответов
10 голосов
4 ответов

Я пытаюсь умножить два вектора вместе, где каждый элемент одного вектора умножается на элемент в...

Sam / 08 ноября 2010
2 голосов
4 ответов

Я хочу оптимизировать следующую функцию с использованием SIMD (SSE2 и т. Д.): int64_t fun(int64_t N...

Eugene Smith / 29 октября 2010
9 голосов
3 ответов

Я собираю немного кода, используя следующие настройки в VC ++ 2010: / O2 / Ob2 / Oi / Ot Однако у...

ronag / 27 октября 2010
3 голосов
3 ответов

Как мне распараллелить мою F # программу, используя набор инструкций SSE3?Поддерживает ли его...

Nishanth / 25 октября 2010
1 голос
1 ответ

Hei! Мне нужно оптимизировать некоторый код умножения матриц в c, и я делаю это, используя...

Rok / 16 октября 2010
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...