Я был вдохновлен этой ссылкой https://www.sigarch.org/simd-instructions-considered-harmful/, чтобы...
По этой ссылке нет предопределенных символов препроцессора для AVX512 ( MSVC 2017 ) Я пытаюсь...
Когда я делаю хранилище AVX-512 с маской записи, например, так: vmovdqu8 [rsi] {k1}, zmm0...
Я хочу задать вопрос о SIMD.Я не получаю AVX512 в своем процессоре, но хочу иметь _mm256_max_epu64
Руководство по встроенным функциям Intel просто утверждает, что _mm512_load_epi32: Загрузка [s]...
Я пытаюсь использовать очень простой пример инструкций по сбору AVX-512: double...
Учитывая число в регистре (двоичное целое число), как преобразовать его в строку шестнадцатеричных...
Я пытаюсь создать минимальный репродуктор для отчета об этой проблеме .Кажется, есть некоторые...
У меня есть сервер с двумя Intel Xeon Gold 6148 и работающим тензорным потоком.Когда я устанавливаю...
Я работаю с Xeon Phi Knights Landing.Мне нужно сделать операцию сбора из массива пар.Список...
Мне часто нужно использовать double по соображениям точности, но я хочу сохранить результаты как...
AVX512 имеет несколько / большинство инструкций с плавающей запятой, доступных в замаскированной...
Я получаю миллионы ошибок при использовании встроенных функций AVX512 в OSX, но только при сборке...
Мне нужно выполнить следующие две операции: float x[4]; float y[16]; // 1-to-4 broadcast for ( int...
У меня есть библиотека C ++, встроенная в Visual Studio 2017, которая использует встроенные функции...
Я оптимизирую простые операции с массивами, такие как for (int i=0; i<cnt; i++) dst[i] = src1[i]...
Я ищу эффективную реализацию AVX (AVX512) // Given float u[8]; float v[8]; // Compute float a[8];...
Обычно существует два типа SIMD-инструкций: A. Те, которые работают с выровненными адресами памяти,...
У меня есть процесс, работающий на машине Intel, которая поддерживает AVX-512, но этот процесс...
Мой дистрибутив Linux обновил мою версию GCC до 5.5.0 (черт побери, если я знаю, почему).Теперь,...
У меня нет Xeon Phi и я не собираюсь его кодировать.Поэтому до тех пор, пока AVX-512 не станет...
Следующий код прекрасно работает с компилятором Intel (версия: 18.0.2), но не для компилятора GNU...
У меня длинный кусок памяти, скажем, 256 КиБ или больше. Я хочу подсчитать количество 1 битов во...