Почему после сопоставления каждого раздела Spark DataFrame с Pandas Dataframe я могу только l oop на его разделы один раз?
Например, у меня будет вывод для этого
columns = sdf.schema.fieldNames()
parts = sdf.repartition(2).rdd.mapPartitions(lambda iterator: [pd.DataFrame(list(iterator), columns=columns)]).toLocalIterator()
for df in parts:
print(df.shape)
Но в следующий раз, когда я запущу l oop:
for df in parts:
print(df.shape)
, практически не будет времени вычислений или вывода.