Поскольку Dask подходит для больших наборов данных, выполнение вычислений на полном источнике данных не имеет смысла.
Я думаю, вам следует сгенерировать файл json путем итерации по разделам.
df.npartitions
дает вам количество разделов.
Вы можете получить определенный c раздел (например, n ) с помощью df.get_partition(n)
.