Я «переводю» код Python в pyspark.Я хотел бы использовать существующий столбец в качестве индекса для данных.Я сделал это на питоне, используя панд.Небольшой фрагмент кода ниже объясняет, что я сделал.Спасибо за помощь.
df.set_index('colx',drop=False,inplace=True)
# Ordena index
df.sort_index(inplace=True)
Я ожидаю, что результатом будет кадр данных с индексом 'colx'.