У меня есть JSON в столбце Spark DataFrame следующим образом:
ID| Text| JSON
------------------------------------------------------------------------------
1| xyz| [{"Hour": 1, "Total": 10, "Fail": 1}, {"Hour": 2, "Total": 40, "Fail": 4}, {"Hour": 3, "Total": 20, "Fail": 2}]
Я использую следующую схему
val schema = StructType(Array(StructField("Hour", IntegerType),
StructField("Total", IntegerType), StructField("Fail", IntegerType))
Я использую следующий код для анализаDataFrame и вывод JSON в виде нескольких столбцов
val newDF = DF.withColumn("JSON", from_json(col("JSON"), schema)).select(col("JSON.*"))
newDF.show()
Приведенный выше код просто анализирует одну запись из JSON.Но я хочу, чтобы он проанализировал все записи в JSON.
Вывод выглядит следующим образом:
Hour| Total| Fail|
-------------------------------
1| 10| 1|
-------------------------------
Но я хочу, чтобы вывод был следующим:
Hour| Total| Fail|
-------------------------------
1| 10| 1|
2| 40| 4|
3| 20| 2|
-------------------------------
Может кто-то, пожалуйста, дайте мне знать.Что мне не хватает !!
Заранее спасибо.