Задержка и пропускная способность инструкций AVX2 - PullRequest
5 голосов
/ 05 апреля 2019

Меня интересуют рабочие характеристики следующих встроенных функций / инструкций:

  • _mm256_andnot_si256 / vpandn
  • _mm256_and_si256 / vpand
  • _mm256_cmpgt_epi32 / vpcmpgtd
  • и некоторые другие.

Но, к сожалению, Intel Intrinsics Guide не содержит таблиц с задержкой и значениями пропускной способности для этих встроенных функций / инструкций. Где я могу найти эту информацию?

1 Ответ

7 голосов
/ 05 апреля 2019

Три источника значений задержки и пропускной способности:

InstlatX64 перечисляет много команд в разных формах (операнды памяти и / или регистра, разные ширины операндов и т. Д.), Но не имеет информации о количестве моповдля каждого порта исполнения.Для оптимизации производительности представляют интерес не только числа задержки и пропускной способности, но также эти значения числа мопов на порт выполнения.Эта информация предоставлена ​​таблицами инструкций Agner Fog и uops.info.

...