Я пытался заставить dask.dataframe использовать локальный распределенный планировщик по умолчанию, но мне непонятно, читая документ Dask о том, как это сделать. Достаточно ли что-то вроде ниже?
from dask import distributed
from dask import dataframe as dd
client = distributed.Client(processes=True) # use multi processing
dask.config.set(scheduler=client)
dd.merge(df1, df2, on='some_col')