скольжение массива с искровыми кадрами - PullRequest
0 голосов
/ 08 ноября 2018

предположим, что данные T_32_P_1_A_420_H_60_R_0.30841494477846165_S_0 используя scala spark dataframe, как разбить на следующий формат

T 32
P 1
A 420
H 60
R 0.30841494477846165
S 0

Любые предложения приветствуются.

Заранее спасибо

1 Ответ

0 голосов
/ 09 ноября 2018

другой пример

+-------+-------------+-----------------------------------------------------------------------------+
|Pcode  |Pname        |Pdetails                                                                     |
+-------+-------------+-----------------------------------------------------------------------------+
|Water12|HimalayaWater|Price,1.20;Qty,250ml;Brand,Himalaya;Class,Liquid                             |
|Snack23|Mad Pringles |Price,0.65;Qty,165 g;Brand,MadLtd;Class,Snacks;Batch,12312334;Exp,12/Feb/2012|
+-------+-------------+-----------------------------------------------------------------------------+

я хочу, чтобы pdeatils были разделены на два столбца Type и Value, и ожидаемый результат равен

+-------+-------------+-----+-----------+
|Pcode  |Pname        |Type |Value      |
+-------+-------------+-----+-----------+
|Water12|HimalayaWater|Price|1.20       |
|Water12|HimalayaWater|Qty  |250ml      |
|Water12|HimalayaWater|Brand|Himalaya   |
|Water12|HimalayaWater|Class|Liquid     |
|Snack23|Mad Pringles |Price|0.65       |
|Snack23|Mad Pringles |Qty  |165 g      |
|Snack23|Mad Pringles |Brand|MadLtd     |
|Snack23|Mad Pringles |Class|Snacks     |
|Snack23|Mad Pringles |Batch|12312334   |
|Snack23|Mad Pringles |Exp  |12/Feb/2012|
+-------+-------------+-----+-----------+
...