Я хочу переформатировать структуру json, используя искровой процесс, в структуру, содержащую массив объектов.Мой входной файл содержит строки:
{ "keyvals" : [[1,"a"], [2, "b"]] },
{ "keyvals" : [[3,"c"], [4, "d"]] }
, и я хочу, чтобы мой процесс вывел
{ "keyvals": [{"id": 1, "value": "a"}, {"id": 2, "value": "c"}] },
{ "keyvals": [{"id": 3, "value": "c"}, {"id": 4, "value": "d"}] }
Какой лучший способ сделать это?
Для просмотраПример ввода, который вы можете запустить в scala spark-shell:
var jsonStrings = Seq("""{"keyvals": [[1,"a"], [2, "b"]] }""", """{ "keyvals" : [[3,"c"], [4, "d"]] }""")
var inputRDD = sc.parallelize(jsonStrings)
var df = spark.sqlContext.read.json(inputRDD)
// reformat goes here ?
df.write.json("myfile.json")
спасибо