Вам не нужно использовать emptyRDD.Вот что у меня работает с PySpark 2.4:
empty_df = spark.createDataFrame([], schema) # spark is the Spark Session
Если у вас уже есть схема из другого фрейма данных, вы можете просто сделать это:
schema = some_other_df.schema
Если нет,затем вручную создайте схему пустого фрейма данных, например:
schema = StructType([StructField("col_1", StringType(), True),
StructField("col_2", DateType(), True),
StructField("col_3", StringType(), True),
StructField("col_4", IntegerType(), False)]
)
Надеюсь, это поможет.