saveAsTextFile в Spark с заголовком на каждой части файла? - PullRequest
1 голос
/ 13 марта 2019

Я хочу добавить заголовок к каждому файлу детали, созданному saveAsTextFile. Один из способов сделать это - использовать mapPartitionsWithIndex вместо saveAsTextFile и записывать содержимое в каждый файл детали самостоятельно, добавляя заголовок к каждому из этих файлов. Но есть ли более элегантный способ сделать это?

1 Ответ

2 голосов
/ 13 марта 2019

Примерно так: если вам нужен индекс раздела, вы можете использовать mapPartitionsWithIndex вместо:

rdd
  .mapPartitions(it => Iterator(Iterator("my header"), it).flatten)
  .saveAsTextFile
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...