Коллеги,
Я пытаюсь кодировать с набором данных 20 Гбайт с Dask на отдельной машине (ядро i5). Сначала я сделал client
для распределенных вычислений:
client = Client()
client
и получил кластер с параметрами: Рабочие: 4 Ядра: 4
Нужно ли сделать dask.config.set(scheduler='threads')
для увеличения скорости (что результат этой настройки?) или сделать client
достаточно?