Эта строка
dd = client.scatter(df, broadcast=True)
скопировал df
каждому из ваших работников. Тем не менее, это единое целое, и в итоге вы отправляете одно задание для работы над ним. Задача - это единица детализации в dask, и Dask не будет разделена.
То, что вы хотели сделать, это разбить ваш фрейм данных на разделы. Вы можете сделать это самостоятельно (df.loc[..]
), но есть также dask.dataframe специально для такого рода манипуляций: например, замена существующих pandas.read_csv
на dask.dataframe.read_csv
.