Я новичок в использовании фреймов данных Spark. Я пытаюсь использовать метод pivot
со Spark (Spark версии 2.x) и сталкиваюсь со следующей ошибкой:
Py4JError: Произошла ошибка при вызове o387.pivot. Трассировка:
py4j.Py4JException: метод pivot ([класс java.lang.String, класс java.lang.String]) не существует
Несмотря на то, что здесь у меня есть функция agg
как first
, мне действительно не нужно применять агрегацию.
Мой фрейм данных выглядит так:
+-----+-----+----------+-----+
| name|value| date| time|
+-----+-----+----------+-----+
|name1|100.0|2017-12-01|00:00|
|name1|255.5|2017-12-01|00:15|
|name1|333.3|2017-12-01|00:30|
Ожидаемое:
+-----+----------+-----+-----+-----+
| name| date|00:00|00:15|00:30|
+-----+----------+-----+-----+-----+
|name1|2017-12-01|100.0|255.5|333.3|
Как я пытаюсь:
df = df.groupBy(["name","date"]).pivot(pivot_col="time",values="value").agg(first("value")).show
В чем здесь моя ошибка?