Сохранить элементы набора данных в файлы с указанным путем - PullRequest
0 голосов
/ 28 июня 2019

У меня есть набор данных класса случая события, который я хотел бы сохранить в нем строковый элемент json в файле на s3 с таким путем, как bucketName / service / yyyy / mm / dd / hh / [SomeGuid] .gz

Так, например, класс случая событий выглядит так:

case class Event(
  hourPath: String,  // e.g. bucketName/service/yyyy/mm/dd/hh/ 
  json: String  // The json line that represents this particular event.
  ... // Other properties used in earlier transformations.
)

Есть ли способ сохранить набор данных, в который мы записываем события, относящиеся к определенному часу, в файл на s3?

Вызов функции partitionBy для DataframeWriter - самый близкий, который я могу получить, но путь к файлу не совсем то, что я хочу.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...