Я конвертирую CSV-файл в паркет и сохраняю его в папке s3, но когда я проверяю местоположение, я получаю более одного файла вместо одного файла?
По умолчанию Spark / Glue записывает данные параллельно, чтобы оптимизировать запись. Вы можете принудительно записать в один файл, используя метод coalesce() перед записью.
coalesce()