Каков эффективный способ создания набора данных для данной схемы с использованием scala? - PullRequest
0 голосов
/ 29 мая 2018

У меня есть набор данных с двумя столбцами col1 и col2 типа массива переменной длины.col1 имеет имя поля схемы, а col2 имеет соответствующие значения.Индекс массива из col1 (который является именем поля схемы) определяет значение из col2.Поля схемы будут получены из различных значений col1 (c1, c2, c3, c4, c5, c6 и c7).Среди c1 до c7 некоторые из них относятся к типу массива (скажем, c3 и c6), а другие - к строковым.

Пример входного набора данных:

     col1                         col2
--------------------------------------------------------------
[c1, c3, c6]                 [aaa, [ab, ac], [bc, bd]]
[c2, c3, c4, c5]             [bbb, [bb, bc], ccc, ddd]
[c4, c6, c7]                 [fff, [ss, pp, l], zzz]

Ожидаемый набор данных:

c1         c2       c3        c4         c5        c6          c7
-------------------------------------------------------------------
aaa       null    [ab, ac]   null      null      [bc, bd]     null
null      bbb     [bb, bc]   ccc       ddd         null       null
null      null      null     fff       null      [ss, pp, l]  zzz
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...