Коммнада dd.read_csv('file.csv', blocksize==1e8)
сгенерирует много команд pd.read_csv(...)
, каждая из которых будет работать на ваших рабочих. Каждая задача будет искать файл file.csv, искать какое-то место в этом файле, определенном вашим размером блока, и считывать эти байты, чтобы создать кадр данных pandas. Файл file.csv должен быть универсально представлен для каждого работника.
Обычно люди используют файлы, которые находятся в общедоступном хранилище, например в сетевой файловой системе, базе данных или хранилище облачных объектов.