Как установить локальный распределенный планировщик в качестве планировщика по умолчанию для dask.dataframe? - PullRequest
0 голосов
/ 12 марта 2020

Я пытался заставить dask.dataframe использовать локальный распределенный планировщик по умолчанию, но мне непонятно, читая документ Dask о том, как это сделать. Достаточно ли что-то вроде ниже?

from dask import distributed
from dask import dataframe as dd
client = distributed.Client(processes=True)  # use multi processing
dask.config.set(scheduler=client)

dd.merge(df1, df2, on='some_col')

1 Ответ

0 голосов
/ 12 марта 2020

Да, это так: если вы создадите распределенный Client любого рода, он станет планировщиком по умолчанию для дальнейших вычислений Dask.

...