Я новичок в Spark и Scala, и я пытаюсь изучить искру для одного из моих учебных проектов.У меня есть файл JSON, который выглядит следующим образом:
[
{
"year": 2012,
"month": 8,
"title": "Batman"
},
{
"year": 2012,
"month": 8,
"title": "Hero"
},
{
"year": 2012,
"month": 7,
"title": "Robot"
}
]
Я начал читать этот JSON для запуска файла DataFrame, поэтому я попытался сделать следующее:
spark.read
.option("multiline", true)
.option("mode", "PERMISSIVE")
.option("inferSchema", true)
.json(filePath)
Он читает JSON, но преобразовывает данныезажечь колонны.Мое требование состоит в том, чтобы читать каждый объект данных как один отдельный столбец.
Я хочу прочитать его в искровой DataFrame, где я ожидаю вывод, подобный следующему:
+----------------------------------------+
|json |
+----------------------------------------+
|{"year":2012,"month":8,"title":"Batman"}|
|{"year":2012,"month":8,"title":"Hero"} |
|{"year":2012,"month":7,"title":"Robot"} |
|{"year":2011,"month":7,"title":"Git"} |
+----------------------------------------+