Используете AVX512 _mm512_loadu_pd () для матрицы столбцов? - PullRequest
0 голосов
/ 25 апреля 2019

Предположим, у меня есть матрица C 31x8, как это:

[C0_0   C0_1   C0_2    ...  C0_7]

[C1_0   C1_1   C1_2    ...  C1_7]

.
.
.

[C30_0 C30_1 C30_3  ... C30_7]

Чтобы установить строку матрицы C в регистр, используя инструкции AVX-512.

Если матрица C является главной строкой, я могу использовать:

register __m512d R00, R01,...,R30;

R00 = _mm512_loadu_pd (&C[0])

R01 = _mm512_loadu_pd (&C[8])
.
.
.

R30 = _mm512_loadu_pd (&C[240])

Но если C - матрица-столбец, я не знаю, как это сделать.

Помогите, пожалуйста, настроить строку матрицы C в регистр на случай, если матрица C равна столбец - мажор .

...