У меня есть файл json со следующими данными:
{
"glossary": {
"title": "example glossary",
"GlossDiv": {
"title": "S",
"GlossList": {
"GlossEntry": {
"ID": "SGML",
"SortAs": "SGML",
"GlossTerm": "Standard Generalized Markup Language",
"Acronym": "SGML",
"Abbrev": "ISO 8879:1986",
"GlossDef": {
"para": "A meta-markup language, used to create markup languages such as DocBook.",
"GlossSeeAlso": [
"GML",
"XML"
]
},
"GlossSee": "markup"
}
}
}
}
}
Мне нужно прочитать этот файл в pyspark и пройти через все элементы в json.Мне нужно распознать все структуры, массива и массива столбцов структуры и создать отдельные таблицы кустов для каждого столбца структуры и массива.
Например:
Глоссарий будет одной таблицей с заголовком в качестве столбца
GlossEntry будет другой таблицейсо столбцами «ID», «SortAs», «GlossTerm», «acronym», «abbrev»
В будущем данные будут расти с увеличением количества вложенных структур.Поэтому мне придется написать обобщенный код, который проходит через все элементы JSON и распознает все структуры и столбцы массива.
Есть ли способ перебрать все элементы во вложенной структуре?