Я определил внешнюю таблицу для группы разделенных файлов паркета следующим образом:
CREATE EXTERNAL TABLE foobarbaz (
src_file string,
[...]
temperature string
)
PARTITIONED BY (dt string)
STORED AS PARQUET
LOCATION '{1}'
Если я тогда запусту
df = spark.table(foobarbaz)
print(df.count())
Я получаю правильный ненулевой результат.
Если я бегу
df = spark.table(foobarbaz)
df.show()
PySpark поднимает
py4j.protocol.Py4JJavaError: Произошла ошибка при вызове o95.showString. [...] Вызвано: java.lang.UnsupportedOperationException
Почему?
полный возврат