Я прошел учебники по Dask, и они всегда начинаются с инициализации клиента:
from dask.distributed import Client
client = Client(n_workers=4)
Меня больше всего интересует использование функции read_csv Dask для параллельного чтения DataFrames на моем ноутбуке.
import dask.dataframe as dd
df = dd.read_csv('trainset.csv').compute()
Несмотря на установку n_workers = 4, Dask использует все ядра при чтении CSV. То же самое, если инициализировать клиента или нет. Нужно ли даже инициализировать клиент, когда я использую Dask локально и только для чтения файлов? Это неявно инициализируется с помощью Dask?