Использование ниже DataFrame Я получаю массив Json, но тип данных - String, где я ищу помощь для преобразования этой строки в массив JSON.
val rawDF = spark.sql("select 1").withColumn("parent_id", lit("Parent_12345")).withColumn("jsonString", lit("""[{"First":{"Info":"ABCD123","Res":"5.2"}},{"Second":{"Info":"ABCD123","Res":"5.2"}},{"Third":{"Info":"ABCD123","Res":"5.2"}}]"""))
rawDF.show(false)
Input and Output DataFrame:
Input DataFrame :
+----------+-------+-----------------------------------------------------------------------------------------------------------------------------------+
|item_id |s_tag |jsonString |
+----------+-------+-----------------------------------------------------------------------------------------------------------------------------------+
|Item_12345|S_12345|[{"First":{"Info":"ABCD123","Res":"5.2"}},{"Second":{"Info":"ABCD123","Res":"5.2"}},{"Third":{"Info":"ABCD123","Res":"5.2"}}] |
+----------+-------+-----------------------------------------------------------------------------------------------------------------------------------+
Output DataFrame :
+----------+-------+-----------------------------------------+
|item_id |s_tag |jsonString |
+----------+-------+-----------------------------------------+
|Item_12345|S_12345|{"First":{"Info":"ABCD123","Res":"5.2"}} |
+----------+-------+-----------------------------------------+
|Item_12345|S_12345|{"Second":{"Info":"ABCD123","Res":"5.2"}}|
+----------+-------+-----------------------------------------+
|Item_12345|S_12345|{"Third":{"Info":"ABCD123","Res":"5.2"}} |
+----------+-------+-----------------------------------------+
Постановка проблемы:
jsonString
- это строковые данные, но выглядит как массив json, я хочу преобразовать / преобразовать этот столбец как массив Json в разбить на возможное количество строк в качестве выходного DataFrame.
Что я пробовал до сих пор:
val jsonArray = udf((value: String) => new JSONArray(value)) // Or how to convert as Array of json.
val strToJsonArray = rawDF.withColumn("arrJson", jsonArray(rawDF("jsonString"))).drop("jsonString") //This is not working.
//If We can convert To Array then using below code I can Split the Json Column in expected Output.
val splittedDF = strToJsonArray.withColumn("splittedJson", explode(strToJsonArray.col("arrJson"))).drop("arrJson")
Как преобразовать мою строку в массив из JSON значений?