Question

Я пишу код SSE для 2D свертки, но документация SSE очень скудна.Я вычисляю точечное произведение с помощью _mm_dp_ps и использую _mm_extract_ps для получения результата точечного произведения, но _mm_extract_ps возвращает гекс, представляющий число с плавающей запятой, и я не могу понять, как преобразовать этот гекс с плавающей точкой в обычный с плавающей точкой.Я мог бы использовать __builtin_ia32_vec_ext_v4sf, который возвращает float, но я хочу сохранить совместимость с другими компиляторами.

_mm_extract_ps (__m128 __X, const int __N)
{
  union { int i; float f; } __tmp;
  __tmp.f = __builtin_ia32_vec_ext_v4sf ((__v4sf)__X, __N);
  return __tmp.i;
}

Какой момент я упускаю?

Небольшая помощь будет оценена, спасибо.

OpenSUSE 11.2GCC 4.4.1C ++Опции компилятора-fopenmp -Wall -O3 -msse4.1 -march = core2Параметры линкера-lgomp -Wall -O3 -msse4.1 -march = core2

Paul R · Answer 1 · 28 июня 2010

Вы должны быть в состоянии использовать _MM_EXTRACT_FLOAT.

Между прочим, мне кажется, что _mm_extract_ps и _MM_EXTRACT_FLOAT должны быть наоборот, т.е. _mm_extract_ps должен возвращать число с плавающей точкой, а _MM_EXTRACT_FLOAT должен возвращать представление int, но что я знаю. *

Ciro Santilli 新疆改造中心996ICU六四事件 · Answer 2 · 01 июня 2019

И просто для иллюстрации всего, что было упомянуто до сих пор:

main.c

#include <assert.h>

#include <x86intrin.h>

int main(void) {

    /* 32-bit. */
    {
        __m128 x = _mm_set_ps(1.5f, 2.5f, 3.5f, 4.5f);

        /* _MM_EXTRACT_FLOAT */
        float f;
        _MM_EXTRACT_FLOAT(f, x, 3);
        assert(f == 1.5f);
        _MM_EXTRACT_FLOAT(f, x, 2);
        assert(f == 2.5f);
        _MM_EXTRACT_FLOAT(f, x, 1);
        assert(f == 3.5f);
        _MM_EXTRACT_FLOAT(f, x, 0);
        assert(f == 4.5f);

        /* _mm_cvtss_f32 + _mm_shuffle_ps */
        assert(_mm_cvtss_f32(x) == 4.5f);
        assert(_mm_cvtss_f32(_mm_shuffle_ps(x, x, 1)) == 3.5f);
        assert(_mm_cvtss_f32(_mm_shuffle_ps(x, x, 2)) == 2.5f);
        assert(_mm_cvtss_f32(_mm_shuffle_ps(x, x, 3)) == 1.5f);
    }

    /* 64-bit. */
    {
        __m128d x = _mm_set_pd(1.5, 2.5);
        /* _mm_cvtsd_f64 + _mm_unpackhi_pd */
        assert(_mm_cvtsd_f64(x) == 2.5);
        assert(_mm_cvtsd_f64(_mm_unpackhi_pd(x, x)) == 1.5);
    }
}

GitHub upstream .

Скомпилируйте иrun:

gcc -ggdb3 -O0 -std=c99 -Wall -Wextra -pedantic -o main.out main.c
./main.out

Двойники, указанные в: _mm_cvtsd_f64 аналог для плавающей запятой высшего порядка

Проверено на Ubuntu 19.04 amd64.

Как преобразовать шестнадцатеричное число с плавающей точкой в число C / C ++ с помощью функции _mm_extract_ps SSE GCC

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как преобразовать шестнадцатеричное число с плавающей точкой в ​​число C / C ++ с помощью функции _mm_extract_ps SSE GCC

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы

Как преобразовать шестнадцатеричное число с плавающей точкой в число C / C ++ с помощью функции _mm_extract_ps SSE GCC