Производительность BLAS очень сильно зависит от системы, поэтому лучше всего проводить тесты самостоятельно на той машине, которую вы хотите использовать. Поскольку существует только несколько реализаций BLAS, это меньше работы, чем кажется (обычно реализация поставщиков оборудования , ATLAS и GOTO BLAS ).
Но обратите внимание, что BLAS охватывает только плотные матрицы, поэтому для умножения разреженных матриц вам понадобится Sparse-BLAS или какой-либо другой код. Здесь производительность будет отличаться не только в зависимости от аппаратного обеспечения, но и от разреженного формата, который вы хотите использовать, и даже от типа матрицы, с которой вы работаете (такие вещи, как разреженность, пропускная способность и т. Д. Имеют значение). Так что даже больше, чем в плотном случае, если вам нужна максимальная производительность, вам нужно будет делать свои собственные тесты.