Преобразовать строку в массив JSON в CSV-файле Spark SQL на чтение - PullRequest
0 голосов
/ 14 марта 2019

У меня есть столбец в CSV-файле с предоставленным форматом

"[{\"xx\":\"yy\"},{\"zz\": \"rrr\"}]"

Мне нужно прочитать его в Spark SQL, чтобы я мог запросить, используя colname.xx, что дает yy

Вот что я попробовал:

df.withColumn("colname", from_json($"colname", schema))
df.selectExpr("split(substring()))

но это не работает.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...