где DataFrameWriter.bucketBy () хранит данные? - PullRequest
0 голосов
/ 16 сентября 2018

Я пытаюсь использовать метод DataFrameWriter.bucketBy () для формирования вывода по заданным столбцам. Но где именно будут храниться выходные данные?

хранится ли он в памяти или его можно сохранить в файловой системе?

Код:

>>> (df.write.format('parquet')  
...     .bucketBy(100, 'year', 'month')
...     .mode("overwrite")
...     .saveAsTable('bucketed_table'))

1 Ответ

0 голосов
/ 16 сентября 2018

saveAsTable всегда будет хранить данные в HDFS как Таблица.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...