Question

Я конвертирую CSV-файл в паркет и сохраняю его в папке s3, но когда я проверяю местоположение, я получаю более одного файла вместо одного файла?

Sandeep Fatangare · Answer 1 · 11 октября 2019

По умолчанию Spark / Glue записывает данные параллельно, чтобы оптимизировать запись. Вы можете принудительно записать в один файл, используя метод coalesce() перед записью.

Почему при конвертации csv в паркет с помощью клея aws создается более одного файла?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Почему при конвертации csv в паркет с помощью клея aws создается более одного файла?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы