Короткий ответ
Плохо
Более длинный ответ
По умолчанию большинство современных реализаций BLAS / LAPACK используют столько потоков, сколько у вас есть логических ядер.Dask сделает то же самое (при условии настройки по умолчанию).Если вы выполняете операции L3 BLAS, то это может привести к гораздо большему количеству активных потоков, чем у вас ядер, и к общему снижению производительности.
Я обычно устанавливаю XXX_NUM_THREADS=1
и полагаюсь на Dask для параллелизма при использовании обоих вместе.