У меня следующие данные фрейма искры. В стране столбца есть 10 различных значений. Я хочу новый массив данных, указанный в ожидаемом результате.
DataFrame
+-------------+--------------+------------------+
| Code| country| t1|
+-------------+--------------+------------------+
| A| Canada| 6218.400000000001|
| A| Central| 30.4|
| A| France|24540.629999999965|
| A| Germany|27688.029999999966|
| A| Northeast| 51.41|
| A| Northwest| 56261.31000000015|
| A| Southeast| 55.71|
| A| Southwest| 92640.42999999833|
| A|United Kingdom| 0.64|
| B| Australia|145856.31999999806|
| C| Canada| 28223.26999999983|
| C| Northwest| 0.87|
| C| Southwest| 0.44|
+-------------+--------------+------------------+
Distinct values for country column are :
+--------------+
| country|
+--------------+
| Australia|
| Canada|
| Central|
| France|
| Germany|
| Northeast|
| Northwest|
| Southeast|
| Southwest|
|United Kingdom|
+--------------+
Expected Result :
+-------------+--------------+------------------+
| Code| country| t1|
+-------------+--------------+------------------+
| A| Australia| null|
| A| Canada| 6218.400000000001|
| A| Central| 30.4|
| A| France|24540.629999999965|
| A| Germany|27688.029999999966|
| A| Northeast| 51.41|
| A| Northwest| 56261.31000000015|
| A| Southeast| 55.71|
| A| Southwest| 92640.42999999833|
| A|United Kingdom| 0.64|
| B| Australia|145856.31999999806|
| B| Canada| null|
| B| Central| null|
| B| France| null|
| B| Germany| null|
| B| Northeast| null|
| B| Northwest| null|
| B| Southeast| null|
| B| Southwest| null|
| B|United Kingdom| null|
| C| Australia|145856.31999999806|
| C| Canada| 28223.26999999983|
| C| Central| null|
| C| France| null|
| C| Germany| null|
| C| Northeast| null|
| C| Northwest| 0.87|
| C| Southeast| null|
| C| Southwest| 0.44|
| C|United Kingdom| null|
Как мне добиться этого ожидаемого результата в Scala? Я сослался на функцию / метод для набора данных, но не смог найти никакой подсказки, с которой я бы начал.
Обратите внимание, что может быть несколько столбцов, поэтому для нескольких столбцов
логика идет так же, что я хочу вставить недостающие категории против каждого
категория во всех столбцах.
Я новичок в разжигании скалы. Заранее спасибо:)