Вопросы с тегом avx2 - PullRequest

Вопросы с тегом avx2

1 голос
1 ответ

Пытаясь пройти курс на Coursera , я попытался оптимизировать пример кода C ++ для моего Intel...

Nanashi No Gombe / 10 июня 2019
0 голосов
1 ответ

Я пробую векторную инструкцию, используя библиотеки "vcl" и "ume" для своего рода сортировки,...

mimi / 08 июня 2019
2 голосов
1 ответ

Могу ли я заставить компилятор компилировать некоторые встроенные функции вне установки -march в...

sandthorn / 05 июня 2019
0 голосов
2 ответов

По сути, я хочу выполнить маску AND над массивом байтов.Я знаю, что код будет выглядеть примерно...

Alexander Irribarra / 05 июня 2019
4 голосов
1 ответ

Есть ли способ получить длину строки ASCII, которая хранится в 16- или 32-байтовом буфере, загрузив...

derik / 05 июня 2019
0 голосов
0 ответов

Я разработал игру, в которой периодически добавляются векторы друг к другу. Например: position +=...

Matthias / 04 июня 2019
1 голос
1 ответ

Я знаю, как проверить, все ли регистры _m128i равны нулю с присущей _mm_test_all_zeros. Какая...

Thomas Kejser / 28 мая 2019
2 голосов
1 ответ

Представьте, что у меня есть эта наивная функция для обнаружения перекрытия сфер.Смысл этого...

Brennan Vincent / 21 мая 2019
6 голосов
1 ответ

Я хотел запустить какой-то код через анализатор IACA, чтобы увидеть, сколько мопов он использовал -...

Froglegs / 16 мая 2019
5 голосов
1 ответ

Мне нужно выполнить битовое сканирование в обратном порядке с помощью LZCNT массива слов: 16 битов....

Guy B / 15 мая 2019
3 голосов
1 ответ

Я пытаюсь оптимизировать следующее sum{vec4[indexarray[i]] * scalar[i]}, где vec4 - это float[4], а...

Avi Ginsburg / 15 мая 2019
2 голосов
2 ответов

Я пытаюсь создать простую программу, которая использует технологию Intel AVX и выполняет умножение...

Pritam Pallab / 02 мая 2019
0 голосов
1 ответ

Когда я проверяю номер цикла модуля, результаты каждого теста совершенно разные? 1781344-->First...

yueluojieying / 25 апреля 2019
2 голосов
1 ответ

Мне нужно оптимизировать следующую операцию сжатия (на сервере с доступными инструкциями AVX2):...

Elton / 25 апреля 2019
4 голосов
1 ответ

Я пытаюсь выяснить, как транспонировать (во встроенных функциях AVX2) прямоугольную матрицу,...

steformicola / 23 апреля 2019
1 голос
1 ответ

В настоящее время я занимаюсь рефакторингом императивной программы на C ++, которая широко...

BufferFluffer / 21 апреля 2019
8 голосов
1 ответ

У меня есть приложение, которое требует, чтобы AVX2 работал правильно.Была реализована проверка для...

Biba / 19 апреля 2019
4 голосов
2 ответов

Следующая функция, кажется, недоступна на AVX512: __m512i _mm512_sign_epi16 (__m512i a, __m512i b)...

yueluojieying / 18 апреля 2019
5 голосов
1 ответ

Меня интересуют рабочие характеристики следующих встроенных функций / инструкций:...

user3234005 / 05 апреля 2019
1 голос
1 ответ

Я пытаюсь увеличить пропускную способность хеша md5 с помощью AVX2. Я использовал библиотеку...

Nathan S / 03 апреля 2019
0 голосов
0 ответов

Мы должны выполнить побитовую операцию XOR для двух массивов, каждый из которых содержит 5...

Muhammad Junaid / 27 марта 2019
1 голос
1 ответ

В Xcode (Версия 10.1 (10B61)) я использовал макрос, как показано ниже, для определения поддержки...

冯剑龙 / 27 марта 2019
3 голосов
2 ответов

, как говорится в вопросе, у меня есть обычный int, который состоит из 8 упакованных значений по 4...

Brennan Vincent / 10 марта 2019
0 голосов
2 ответов
1 голос
1 ответ

Я использую _mm256_cvtps_epi32() для преобразования из 8 float с в 8x32-битные целые числа.Но цель...

Serge Rogatch / 07 марта 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...