Недавно я работал над некоторыми проблемами кодирования, которые включали передачу фрейма данных Spark в функцию Python и возвращение нового фрейма данных. Синтаксис, который я помню, был примерно таким:
def sampleFunction(df: Dataframe) -> Dataframe:
* do stuff *
return newDF
Сейчас я пытаюсь создать свои собственные примеры, но не могу указать фрейм данных в качестве типа ввода / вывода. Я предполагаю, что есть что-то, что мне нужно импортировать, чтобы сделать фрейм данных приемлемым типом, но я безостановочно гуглил в течение последнего часа и не могу найти ни одного примера, как заставить это работать в PySpark.