Dask на одной машине OSX - это параллельно по умолчанию? - PullRequest
0 голосов
/ 13 марта 2019

Я установил Dask на OSX Mojave.По умолчанию он выполняет вычисления параллельно?Или мне нужно изменить некоторые настройки?

Я использую API DataFrame.Имеет ли это значение для ответа?

Я установил его с помощью pip.Имеет ли это значение для ответа?

1 Ответ

1 голос
/ 13 марта 2019

Да, Dask является параллельным по умолчанию.

Если вы не укажете иное или не создадите распределенный Client, выполнение будет выполняться с помощью «многопоточного» планировщика в количестве потоков, равном количеству ядер. Обратите внимание, однако, что из-за Python GIL (выполняется только одна инструкция Python за раз), вы можете не получить столько параллелизма, сколько доступно, в зависимости от того, насколько хороши ваши конкретные задачи по выпуску GIL. Вот почему у вас есть выбор планировщиков.

Находясь на OSX, устанавливая с помощью pip: это не имеет значения. Использование фреймов данных делает разницу в том, что они определяют виды задач, которые вы, вероятно, выполняете. Панды умеют выпускать GIL для многих операций.

...