Есть существенные различия между multiprocessing
и multithreading
. Смотрите мой ответ здесь для краткого комментария по различиям.В вашем случае это приводит только к ускорению в 2 раза вместо, скажем, ускорения в 10–50 раз плюс.
По сути, ваша проблема не масштабируется, а добавляется больше ядер, чем при добавлении потоков (так какэто связано с вводом / выводом ... не связано с процессором).
Настройка Dask для работы в режиме multithreaded
вместо режима multiprocessing
.Я не уверен, как это сделать в dask
, но эта документация может помочь