Добрый день, коллеги, я не могу решить проблему с преобразованием.
Пример набора данных:
+--------------------------------------+
| Col1 Col2 Col3 Col2 Col3 |
+--------------------------------------+
| Value 1 Value 2 123 |
| Value 1 Value 2 124 |
| Value 1 Value 2 125 |
+--------------------------------------+
Необходимый вывод:
+--------------------------------------------------------+
|Col1 Col2 Col3 Col2 Col3 |
+--------------------------------------------------------+
| Value 1 Value 2 123 124 125 |
+--------------------------------------------------------+
Я сделал этов Юпитере с Apache Toree, и это выглядит так:
val z = spark.read.parquet("/*/*.parquet")
val d = z.groupBy("Col1","Col2").agg(first(col("Col3"),true).as("Col3"),first(col("Col4"),true).as("Col4"),first(col("Col5"),true).as("Col5")))
Как это сделать с Java Spark Api?