Нет!
Pyspark groupby вызывает случайное перемешивание, и это случайное перемешивание не гарантирует для сохранения любого ранее существующего порядка. Чтобы обработать данные в порядке на сгруппированной карте, отсортируйте набор данных в верхней части UDF.
@pandas_udf(my_schema, PandasUDFType.GROUPED_MAP)
def my_udf(key_group):
# Key group is not guaranteed to be ordered by key2 at this point!!
key_group = key_group.sort_values("key2")
# Now it's ordered by key2 and I can do my processing
...
return my_processed_data
df.orderBy("key1", "key2").groupBy("key1").apply(my_udf)