Вопросы с тегом SSE - PullRequest

Вопросы с тегом SSE

3 голосов
1 ответ

«Обычные» регистры в x86 имеют размер только 32-битные, поэтому вы не можете использовать их для...

Tom / 14 апреля 2019
1 голос
2 ответов

У меня есть следующий цикл: float* s; float* ap; float* bp; ... // initialize s, ap, bp for(size_t...

Taylor / 06 апреля 2019
14 голосов
1 ответ

__m256 dst = _mm256_cmp_ps(value1, value2, _CMP_LE_OQ); Если dst равно [0,0,0,-nan, 0,0,0,-nan]; Я...

hidayat / 31 марта 2019
1 голос
0 ответов

В этом вопросе спрашивающий задавался вопросом, можно ли ожидать, что операции с плавающей запятой...

fuglede / 27 марта 2019
3 голосов
3 ответов

Примите во внимание следующее: // foo.h class Foo { public: int x = 2; int y = 3; void...

Angus H / 22 марта 2019
3 голосов
2 ответов

, как говорится в вопросе, у меня есть обычный int, который состоит из 8 упакованных значений по 4...

Brennan Vincent / 10 марта 2019
2 голосов
1 ответ

Я учусь использовать встроенные функции SIMD и автовекторизацию. К счастью, у меня есть полезный...

SapphireSun / 08 марта 2019
0 голосов
1 ответ

Я ищу эффективные способы вычисления следующей функции: Ввод: __m128i data, uint8_t in; Вывод:...

redplum / 27 февраля 2019
0 голосов
1 ответ

Я хочу написать математическую функцию с инструкциями SSE в VS2017.Я мог бы попробовать это: __m128...

QuickDzen / 26 февраля 2019
0 голосов
1 ответ

Просто учитывая, что нужно сделать при переносе некоторого программного обеспечения в облако

simba / 16 февраля 2019
0 голосов
1 ответ

Вот фиктивный код, который у меня есть, тестирующий выровненное выделение памяти в куче с...

markzzz / 08 февраля 2019
0 голосов
2 ответов

Прежде всего, я новичок в SSE.Я решил ускорить мой код, но кажется, что он работает медленнее, чем...

user1554270 / 07 февраля 2019
0 голосов
4 ответов
0 голосов
1 ответ

Почему я получаю такое огромное ускорение (в 16 раз), используя __m256 тип данных?За один раз...

Kari / 28 января 2019
0 голосов
1 ответ

Я хочу выполнить произвольную перестановку единичных битов, пар битов и кусков (4 бита) в регистре...

J Bausch / 28 января 2019
0 голосов
1 ответ

Я заметил действительно странное поведение, когда я играл с функцией libc system () в Linux x86-64,...

shaqed / 28 января 2019
0 голосов
0 ответов

С правильно сконструированным кодом C / C ++ можно подсказать gcc для создания эффективного...

Wojciech Migda / 23 января 2019
0 голосов
1 ответ

Я изучал инструкции SSE и обнаружил странную ошибку с ассемблером GNU as, когда пытался скопировать...

Ich445 / 21 января 2019
0 голосов
0 ответов

Есть ли способ связать объекты, скомпилированные с GCC, без отключения инструкций SSE, статически с...

Petri Isomäki / 17 января 2019
0 голосов
1 ответ

Я хочу вычислить среднее значение изображения (3 канала интереса + 1 альфа-канал, которые мы здесь...

Aurélien Pierre / 17 января 2019
0 голосов
1 ответ

Я нахожу трудности в создании кода для этой, казалось бы, легкой проблемы. Учитывая упакованное...

senseiwa / 15 января 2019
0 голосов
2 ответов

Я использую Fasm (сборка) и ищу инструкции по сборке SSE2, эквивалентные этим встроенным...

FigFox François Giron / 12 января 2019
0 голосов
2 ответов

Все еще изучая искусство SIMD, у меня есть вопрос: у меня есть два упакованных 8-битных регистра,...

senseiwa / 11 января 2019
0 голосов
1 ответ

У меня большая кодовая база, широко использующая встроенные функции SSE, которая была разработана в...

galinette / 10 января 2019
0 голосов
1 ответ

Если у меня есть 2 денормальных числа с плавающей запятой с разными битовыми комбинациями и я...

Zachary Burns / 05 января 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...