Вы неправильно понимаете, как работает Dask - поведение, которое вы видите, соответствует ожидаемому.Чтобы иметь возможность записи из нескольких рабочих параллельно, каждому рабочему необходимо иметь возможность записи в отдельный файл;например, нет способа узнать длину первого фрагмента до того, как запись будет закончена.Поэтому запись в один файл обязательно является последовательной операцией.
Поэтому операция по умолчанию - это запись одного выходного файла для каждого входного раздела, и это то, что вы видите.Поскольку Dask может читать из них параллельно, возникает вопрос, зачем вам вообще создавать один выходной файл.
Для второго метода без символа "*" Dask предполагает, что выпредоставляя каталог, а не файл, и пытается записать в него два файла, которых не существует.
Если вы действительно хотите написать один файл, вы можете сделать одно из следующих действий:
- использовать метод перераспределения для создания одного выходного фрагмента, а затем to_csv
- записать отдельный файл и объединить их после факта (с учетом строки заголовка)
- итерируйте последовательно разделы вашего фрейма данных, чтобы записать в тот же файл.