Как преобразовать DataFrame во вложенный JSON - PullRequest
0 голосов
/ 09 мая 2019

Я пытаюсь экспортировать dataFrame во вложенный JSON (иерархический) для D3.js, используя решение , которое только для одного уровня (родитель, дети)

Любая помощь будетбыть оцененнымЯ новичок в python

Мой DataFrame содержит 7 уровней Вот ожидаемое решение

JSON Example:
    "name": "World",
    "children": [
            "name": "Europe",
            "children": [
                    "name": "France",
                    "children": [
                             "name": "Paris",
                             "population": 1000000

и вот метод python:

def to_flare_json(df, filename):
    """Convert dataframe into nested JSON as in flare files used for D3.js"""
    flare = dict()
    d = {"name":"World", "children": []}

    for index, row in df.iterrows():
        parent = row[0]
        child = row[1]
        child1 = row[2]
        child2 = row[3]
        child3 = row[4]
        child4 = row[5]
        child5 = row[6]
        child_value = row[7]

        # Make a list of keys
        key_list = []
        for item in d['children']:

        #if 'parent' is NOT a key in flare.JSON, append it
        if not parent in key_list:
            d['children'].append({"name": parent, "children":[{"value": child_value, "name1": child}]})
        # if parent IS a key in flare.json, add a new child to it
            d['children'][key_list.index(parent)]['children'].append({"value": child_value, "name11": child})
    flare = d
    # export the final result to a json file
    with open(filename +'.json', 'w') as outfile:
        json.dump(flare, outfile, indent=4,ensure_ascii=False)
    return ("Done")


Вот образец моей ДФ

World   Continent   Region  Country     State   City    Boroughs    Population
1   Europe  Western Europe  France  Ile de France   Paris   17  821964
1   Europe  Western Europe  France  Ile de France   Paris   19  821964
1   Europe  Western Europe  France  Ile de France   Paris   20  821964

Ответы [ 2 ]

0 голосов
/ 10 мая 2019

Спасибо Syncrossus за ответ, но этот результат в разных ветках для каждого района или города. Результат такой:

"Name": "World",
    "Children": [
            "Name": "Western Europe",
            "Children": [
                    "Name": "France",
                    "Children": [
                            "Name": "Ile de France",
                            "Children": [
                                    "Name": "Paris",
                                    "Children": [
                                            "Name": "17ème",
                                            "Population": 821964
            "Name": "Western Europe",
            "Children": [
                    "Name": "France",
                    "Children": [
                            "Name": "Ile de France",
                            "Children": [
                                    "Name": "Paris",
                                    "Children": [
                                            "Name": "10ème",
                                            "Population": 154623

Но желаемый результат - это

"Name": "World",
    "Children": [
        "Continent": "Europe",
        "Children": [
            "Region": "Western Europe",
            "Children": [
                "Country": "France",
                "Children": [
                    "State": "Ile De France",
                    "Children": [
                        "City": "Paris",
                        "Children": [
                            "Boroughs": "17ème",
                            "Population": 82194
                            "Boroughs": "16ème",
                            "Population": 99194
                        "City": "Saint-Denis",
                        "Children": [
                              "Boroughs": "10ème",
                              "Population": 1294
                              "Boroughs": "11ème",
                              "Population": 45367
                  "Country": "Belgium",
                  "Children": [
                      "State": "Oost-Vlaanderen",
                      "Children": [
                          "City": "Gent",
                          "Children": [
                              "Boroughs": "2ème",
                              "Population": 1234
                              "Boroughs": "4ème",
                              "Population": 7456

0 голосов
/ 09 мая 2019

Структура, которую вы хотите, явно рекурсивная, поэтому я сделал рекурсивную функцию для ее заполнения:

def create_entries(df):
    entries = []
    # Stopping case
    if df.shape[1] == 2:  # only 2 columns left
        for i in range(df.shape[0]):  # iterating on rows
                {"Name": df.iloc[i, 0],
                 df.columns[-1]: df.iloc[i, 1]}
    # Iterating case
        values = set(df.iloc[:, 0])  # Getting the set of unique values
        for v in values:
                {"Name": v,
                 # reiterating the process but without the first column
                 # and only the rows with the current value
                 "Children": create_entries(
                     df.loc[df.iloc[:, 0] == v].iloc[:, 1:]
    return entries

Осталось только создать словарь и вызвать функцию:

mydict = {"Name": "World",
          "Children": create_entries(data.iloc[:, 1:])}

Затем вы просто записываете ваш dict в файл JSON.

Я надеюсь, что мои комментарии достаточно явны, идея состоит в том, чтобы рекурсивно использовать первый столбец набора данных как «Имя», а остальные как «Дети».».

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.