Я использую partitionBy
, но я не совсем понимаю, почему мы должны это использовать.
У меня есть запись в формате csv, подобная этой:
--------------------------- ---------
name | age | entranceDate | dropDate |
--------------------------------------
Tom | 12 | 2019-10-01 | null |
--------------------------------------
Mary | 15 | 2019-10-01 | null |
--------------------------------------
Что произойдетесли я использую:
String[] partitions =
new String[] {
"name",
"entranceDate"
};
df.write()
.partitionBy(partitions)
.mode(SaveMode.Append)
.parquet(parquetPath);
А что если я разделю на столбец null
:
String[] partitions =
new String[] {
"name",
"dropDate"
};
df.write()
.partitionBy(partitions)
.mode(SaveMode.Append)
.parquet(parquetPath);
Может кто-нибудь объяснить, как это работает?Спасибо.