Прямого пути в spark.read.format
нет, но вы можете использовать where
условие
val df = spark.read.format("orc").load("mytable").where(yourparitioncolumn)
, если , пока вы не выполните действие, ничего не загружено , поскольку load
(указывая на ваше местоположение файла или c) просто забавно c в DataFrameReader
, как показано ниже, он не загружается, пока не выполнено действие.
см. здесь DataFrameReader
def load(paths: String*): DataFrame = {
...
}
В приведенном выше коде, т.е. spark.read
.... where
- это просто where
условие, когда вы указываете это, опять данные не будут загружаться немедленно :-)
когда вы говорите df.count
, тогда ваш столбец разделов будет применен к пути данных или c.