У меня есть файл Json, который выглядит следующим образом
{
"tags": [
{
"1": "NpProgressBarTag",
"2": "userPath",
"3": "screen",
"4": 6,
"12": 9,
"13": "buttonName",
"16": 0,
"17": 10,
"18": 5,
"19": 6,
"20": 1,
"35": 1,
"36": 1,
"37": 4,
"38": 0,
"39": "npChannelGuid",
"40": "npShowGuid",
"41": "npCategoryGuid",
"42": "npEpisodeGuid",
"43": "npAodEpisodeGuid",
"44": "npVodEpisodeGuid",
"45": "npLiveEventGuid",
"46": "npTeamGuid",
"47": "npLeagueGuid",
"48": "npStatus",
"50": 0,
"52": "gupId",
"54": "deviceID",
"55": 1,
"56": 0,
"57": "uiVersion",
"58": 1,
"59": "deviceOS",
"60": 1,
"61": 0,
"62": "channelLineupID",
"63": 2,
"64": "userProfile",
"65": "sessionId",
"66": "hitId",
"67": "actionTime",
"68": "seekTo",
"69": "seekFrom",
"70": "currentPosition"
}
]
}
Я пытался создать фрейм данных, используя
val path = "some/path/to/jsonFile.json"
val df = sqlContext.read.json(path)
df.show()
, когда я запускаю это, я получаю
df: org.apache.spark.sql.DataFrame = [_corrupt_record: string]
Как создать df на основе содержимого ключа «tags»?все, что мне нужно, это вытащить данные из «тегов» и применить класс case как это
case class ProgLang (id: String, type: String )
Мне нужно преобразовать эти данные json в dataframe с именами двух столбцов.какой-то свет на эту ошибку?