Панды применяются медленно.Поскольку вы работаете построчно с функцией Python, он должен использовать Python для циклов, а не C для циклов.
В планировщике по умолчанию Dask dataframe используются потоки, которые обычно очень хороши для быстрых векторизованных операций Pandas, ноне поможет для медленных операций Pandas, которые связаны кодом Python.Вы можете попробовать использовать многопроцессорные или распределенные планировщики.См. http://docs.dask.org/en/latest/scheduling.html
Тем не менее, я рекомендую вам лучше использовать Панд перед тем, как попробовать Dask.Вероятно, использование быстрых API-интерфейсов Pandas может значительно ускорить ваши вычисления, чем Dask.