Как правильно читать папку, якобы содержащую файлы Parquet из Spark, если папка пуста - PullRequest
0 голосов
/ 22 ноября 2018

Когда я пытаюсь прочитать папку, которая предположительно содержит файлы в формате Parquet, все работает, если есть данные, если нет данных, я получаю сообщение об ошибке в первой строке, и последующий код не выполняется

val hdfsData: DataFrame = spark.sqlContext.read.parquet(hdfsPath)
hdfsData.rdd.isEmpty() match ....
....

Ошибка: org.apache.spark.sql.AnalysisException: Невозможно определить схему для Parquet.Он должен быть указан вручную.;

Как правильно обрабатывать этот сценарий.

...