Я рекомендую использовать для вычисления различное количество процессов с аргументом ключевого слова num_workers
.
Вопреки сказанному выше, read_csv определенно привязан к вычислениям, и, вероятно, несколько параллельных процессов будут работать параллельноhelp.
Тем не менее, слишком большое количество процессов, которые все забивают на диск одновременно, могут вызвать много споров и замедлить процесс.
Я рекомендую немного поэкспериментировать с различным числом процессов.чтобы увидеть, что работает лучше всего.