Да, Dask является параллельным по умолчанию.
Если вы не укажете иное или не создадите распределенный Client
, выполнение будет выполняться с помощью «многопоточного» планировщика в количестве потоков, равном количеству ядер. Обратите внимание, однако, что из-за Python GIL (выполняется только одна инструкция Python за раз), вы можете не получить столько параллелизма, сколько доступно, в зависимости от того, насколько хороши ваши конкретные задачи по выпуску GIL. Вот почему у вас есть выбор планировщиков.
Находясь на OSX, устанавливая с помощью pip: это не имеет значения. Использование фреймов данных делает разницу в том, что они определяют виды задач, которые вы, вероятно, выполняете. Панды умеют выпускать GIL для многих операций.