У меня есть массив вложенных объектов JSON, подобный этому:
[
{
"a": 1,
"n": {}
}
]
Я хотел бы прочитать этот JSON-файл (многострочный) в искровой DataFrame с одним столбцом. Где столбец имеет StringType и содержит объект JSON:
+----------+
| json |
+----------+
| {"a": 1, |
| "n": {}} |
+----------+
Я пытался сделать следующее:
schema = StructType([StructField("json", StringType(), True)])
spark.read.json('test.json', multiLine=True).show()
Но это не сработало. Есть ли варианты сделать это в PySpark?