Я написал простую программу, которая запрашивает огромную базу данных.Чтобы экспортировать мой результат, я написал эту функцию:
result.coalesce(1).write.options(Map("header" -> "true", "delimiter" > ";")).csv(mycsv.csv)
Я использую метод coalesce
, чтобы получить только один файл в качестве вывода.Проблема в том, что файл результатов содержит более миллиона строк.Итак, я не смог открыть его в Excel ...
Итак, я подумал об использовании метода (или написать свою собственную функцию с помощью цикла for), который может создавать разделы, связанные с количеством строк вмой файл.Но я понятия не имею, как мне это сделать.
Моя идея состоит в том, что если у меня будет менее миллиона строк, у меня будет один раздел.Если у меня более одного миллиона => двух разделов, 2 миллиона => 3 раздела и т. Д.
Можно ли сделать что-то подобное?