У меня есть искровой фрейм данных, который я хочу развернуть и который имеет два одинаковых, но в разных случаях значения - test
и Test
в приведенном ниже примере. Рассмотрим следующий пример:
df = spark.createDataFrame([["R","test",1],["R","Test",2]], ["A", "B", "C"])
df.show()
df2 = df.groupby('A').pivot('B').max('C').fillna(0).cache()
df2.show()
Я бы ожидал следующий вывод
+---+----+---+
| A| B| C|
+---+----+---+
| R|test| 1|
| R|Test| 2|
+---+----+---+
+---+----+----+
| A|Test|test|
+---+----+----+
| R| 2| 1|
+---+----+----+
Но вместо этого выдается следующее исключение:
org.apache.spark.sql.AnalysisException: Reference 'Test' is ambiguous, could be: Test, Test.
Как мне Поворот на столбцы, которые имеют одинаковые значения в разных случаях, как это?