Question

Я пытался заставить dask.dataframe использовать локальный распределенный планировщик по умолчанию, но мне непонятно, читая документ Dask о том, как это сделать. Достаточно ли что-то вроде ниже?

from dask import distributed
from dask import dataframe as dd
client = distributed.Client(processes=True)  # use multi processing
dask.config.set(scheduler=client)

dd.merge(df1, df2, on='some_col')

mdurant · Answer 1 · 12 марта 2020

Да, это так: если вы создадите распределенный Client любого рода, он станет планировщиком по умолчанию для дальнейших вычислений Dask.

Как установить локальный распределенный планировщик в качестве планировщика по умолчанию для dask.dataframe?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как установить локальный распределенный планировщик в качестве планировщика по умолчанию для dask.dataframe?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы