Вопросы с тегом SSE - PullRequest

Вопросы с тегом SSE

7 голосов
2 ответов

Допустим, у меня есть какая-то 16-байтовая выровненная структура, которая просто оборачивает массив...

J. Doe / 08 октября 2019
2 голосов
1 ответ

я использую FASM, и это моя программа format ELF64 section '.text' executable public func...

Jason / 29 сентября 2019
2 голосов
0 ответов

Похоже, gcc с радостью автоматически векторизует простые примеры и запускает инструкции SSE.Есть ли...

Ant6n / 29 сентября 2019
2 голосов
1 ответ

Я использовал отличный godbolt.org, чтобы определить, что gcc делает и не векторизует: но я не могу...

nickpelling / 24 сентября 2019
2 голосов
1 ответ

Мне нужно переместить 16-битное слово восемь раз в регистр xmm для операций SSE E. g .: Я бы хотел...

mo_st / 11 июля 2019
3 голосов
1 ответ

Я хочу сохранить 4 32-битных числа с плавающей запятой в xmm0, где каждое из этих значений с...

pedzer / 05 июля 2019
0 голосов
0 ответов

Для кода не-SSE, как было дано в ответе на следующий вопрос ( Нет исключения переполнения для int в...

DragonSpit / 04 июля 2019
3 голосов
1 ответ

Я пытаюсь обернуть голову вокруг доступа к памяти внутренним типам, которые загружены или не...

scx / 23 июня 2019
3 голосов
3 ответов

Я хотел бы ускорить вычисление векторов, и я считаю, что SIMD-инструкции для сравнения и...

Sindbag / 19 июня 2019
2 голосов
1 ответ

Почему моя функция длины SIMD vector4 в 3 раза медленнее, чем метод длины простого вектора? Функция...

user1679740 / 17 июня 2019
3 голосов
1 ответ

В Как выполнить инверсию _mm256_movemask_epi8 (VPMOVMSKB)? , OP запрашивает инверсию...

Vortico / 16 июня 2019
2 голосов
1 ответ

Существует два способа реализации накопления в sse встроенных. Но один из них получает неправильный...

冯剑龙 / 13 июня 2019
4 голосов
1 ответ

Я смотрю на MMX / SSE и мне интересно.Существуют инструкции для упакованного, насыщенного вычитания...

z0rberg's / 10 июня 2019
12 голосов
2 ответов

Скажем, у меня есть 2 двоичных входа с именами IN и MASK.Фактический размер поля может составлять...

muusbolla / 06 июня 2019
4 голосов
1 ответ

Есть ли способ получить длину строки ASCII, которая хранится в 16- или 32-байтовом буфере, загрузив...

derik / 05 июня 2019
7 голосов
2 ответов

Мне нужен совет SSE / AVX по оптимизации подпрограммы, которая предварительно умножает канал RGB с...

Mathieu Garaud / 03 июня 2019
1 голос
2 ответов

Допустим, я хочу изменить порядок байтов очень большого байтового массива. Я могу сделать это...

derik / 01 июня 2019
1 голос
0 ответов

Вопрос прост, но я до сих пор не могу найти ответ: Как я могу использовать SIMD Intrinsics в коде...

senseiwa / 27 мая 2019
3 голосов
1 ответ

Если мое понимание верно, _mm_movehdup_ps(a) дает тот же результат, что и _mm_shuffle_ps(a, a,...

ThreeStarProgrammer57 / 21 мая 2019
0 голосов
1 ответ

Я хочу спросить, какая польза от операции MOVMSKB? Я пытаюсь найти документацию, но не могу найти...

TIANYANG ZHANG / 16 мая 2019
3 голосов
2 ответов

У меня есть некоторый код, использующий встроенную AVX2 _mm256_permutevar8x32_epi32 aka vpermd для...

John Zwinck / 08 мая 2019
1 голос
1 ответ

MOVHPD извлекает старшее четырехзначное слово регистра xmm в память. PEXTRQ извлекает старшее...

RTC222 / 19 апреля 2019
1 голос
2 ответов

Интересно, как компилятор обрабатывает встроенные функции. Если кто-то использует встроенные...

Royi / 18 апреля 2019
3 голосов
2 ответов

Я искал опцию SIMD для ускорения сравнений и нашел функцию __m128d _mm_cmpgt_sd (__m128d a, __m128d...

Jimbo / 16 апреля 2019
1 голос
1 ответ

Изучая преобразование ffmpeg из yuv в rgb, я наткнулся на уравнение, реализуемое в ассемблере,...

MaikonNascimento / 16 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...