Вопросы с тегом AVX - PullRequest

Вопросы с тегом AVX

0 голосов
0 ответов

Я сейчас снова сравниваю компиляторы.Моя цель - в основном довольно простые циклы DSP с...

Vojtěch Melda Meluzín / 26 сентября 2018
0 голосов
1 ответ

У меня есть два вектора __m256i, заполненные 32 8-битными целыми числами.Примерно так: __int8 *a0 =...

KaraUL / 17 сентября 2018
0 голосов
1 ответ

Идея состоит в том, что я хотел бы собрать возвращенные значения double в векторный регистр для...

sandthorn / 13 сентября 2018
0 голосов
0 ответов

Я пытаюсь портировать встроенные функции Intel AVX на платформу arm64.Мой код содержит типы...

weegz / 10 сентября 2018
0 голосов
1 ответ

У меня есть простой цикл: for (ii = 0; ii < numRows * numCols; ii++) { mCOmega[ii] =...

Royi / 07 сентября 2018
0 голосов
0 ответов

Я пытаюсь сравнить производительность между скалярным кодом и кодом Intel AVX (SIMD), компилируемым...

P.L / 03 сентября 2018
0 голосов
2 ответов

Обычно существует два типа SIMD-инструкций: A. Те, которые работают с выровненными адресами памяти,...

MikeF / 03 сентября 2018
0 голосов
2 ответов

У меня есть случай использования, где у меня есть массив битов, каждый бит представлен как 8-битное...

yadhu / 30 августа 2018
0 голосов
1 ответ

Я пытаюсь написать код C, который маскирует задержку процессора при использовании конвейерной...

IamIC / 27 августа 2018
0 голосов
2 ответов

Я пытаюсь использовать pycocotools из python: $ ipython Python 3.6.5 | packaged by conda-forge |...

Jean-Pat / 27 августа 2018
0 голосов
1 ответ

Кажется, не существует версии vbroadcastsd, которая использует 64-битный операнд источника памяти с...

BeeOnRope / 24 августа 2018
0 голосов
1 ответ

Информация о задержке и пропускной способности _mm256_setr_epi32 () отсутствует в руководстве по...

yatsukino / 05 июля 2018
0 голосов
0 ответов

Мой проект интенсивно использует logsumexp в алгоритме. В настоящее время я использую эту...

user2131907 / 03 июля 2018
0 голосов
2 ответов

У меня есть тривиальный цикл, который я ожидаю увидеть регистры YMM в сборке, но вижу только XMM...

Morph / 02 июля 2018
0 голосов
1 ответ

Недавно я обнаружил, что у AVX2 нет поп-счета для __m256i, и единственный способ сделать что-то...

yatsukino / 29 июня 2018
0 голосов
1 ответ

Я скомпилировал свою программу на С ++ на машине, которая поддерживает avx2 (Intel E5-2643 V3). Он...

werk / 29 июня 2018
0 голосов
1 ответ

Я недавно заинтересовался оптимизацией SIMD после того, как через некоторое время снова захотел...

Thecheeselover / 27 июня 2018
0 голосов
1 ответ

Моя цель - разработать код, который компилируется с использованием SIMD-инструкций, когда они...

Jimbo / 13 июня 2018
0 голосов
1 ответ

Я бы хотел лучше понять, почему два очень похожих фрагмента кода на моем компьютере работают...

Chris Elrod / 08 июня 2018
0 голосов
1 ответ

У меня есть следующий фрагмент кода, который может использовать SIMD.Он прекрасно работает в Linux...

user1134621 / 06 июня 2018
0 голосов
2 ответов

Я хочу ускорить следующую операцию с инструкциями AVX2, но мне не удалось найти способ сделать это....

Ward Beullens / 29 мая 2018
0 голосов
1 ответ

Я хотел бы реализовать numpy.triu_indices (a, 1) (обратите внимание, что вторым аргументом является...

Roy_123 / 25 мая 2018
0 голосов
0 ответов

У меня уже есть SIMD сравниваемый регистр __m128i, что приводит к чему-то вроде: 0, 0, -1, -1, 0, 0...

Thorgas / 24 мая 2018
0 голосов
1 ответ

Я написал следующий код для масштабирования набора чисел: #include <stdio.h> #include...

A.SDR / 22 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...