Question

У меня есть столбец в CSV-файле с предоставленным форматом

"[{\"xx\":\"yy\"},{\"zz\": \"rrr\"}]"

Мне нужно прочитать его в Spark SQL, чтобы я мог запросить, используя colname.xx, что дает yy

Вот что я попробовал:

df.withColumn("colname", from_json($"colname", schema))
df.selectExpr("split(substring()))

но это не работает.

Преобразовать строку в массив JSON в CSV-файле Spark SQL на чтение

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.