У меня есть два DataFrames с одним столбцом каждый (300 строк каждый):
df_realite.take(1)
[Row(realite=1.0)]
df_proba_classe_1.take(1)
[Row(probabilite=0.6196931600570679)]
Я хотел бы сделать один DataFrame с двумя столбцами.
Я попробовал:
_ = spark.createDataFrame([df_realite.rdd, df_proba_classe_1.rdd] ,
schema=StructType([ StructField('realite' , FloatType() ) ,
StructField('probabilite' , FloatType() ) ]))
Но
_.take(10)
дает мне пустые значения:
[Row(realite=None, probabilite=None), Row(realite=None, probabilite=None)]