Существует ли встроенная функция x86, которая генерирует широковещательную операцию AVX512 из 32-разрядного значения с плавающей запятой в памяти в 512-разрядный регистр? - PullRequest
1 голос
/ 01 декабря 2019

Инструкция существует (vbroadcastss zmm/m32), но, похоже, не существует встроенной для ее генерации.

Я могу закодировать ее как

static inline  __m512 mybroadcast(float *x) {
    __m512 v;
    asm inline ( "vbroadcastss %1,%0 "
                 : "=v" (v)
                 : "m" (*x)
                 );
    return v;
}

Есть ли способ сделать это безвстроенный asm?

...