Question

У меня есть список словарей, подобных этому:

dictionary = [{
    'vendor': 'vendor1',
    'option_list': [{
        'col1_name': 'Column1',
        'col1_options': ['option1', 'option2', 'option3']
        }, {
        'col2_name': 'Column2',
        'col2_options': ['small']
        },  {
        'col3_name': 'Column3',
        'col3_options': ['yellow', 'black', 'green']
        }
    ]
},  {
    'vendor': 'vendor2',
    'option_list': [{
        'col1_name': 'Column1',
        'col1_options': ['option3']
        }, {
        'col2_name': 'Column2',
        'col2_options': ['small', 'medium', 'large']
        }, {
        'col3_name': 'Column3',
        'col3_options': ['yellow', 'green']
        }
    ]
}]

И я хочу превратить это в панду DataFrame, как это:

Vendor    Column1    Column2    Column3
vendor1   option1    small      yellow
vendor1   option2    NaN        black
vendor1   option3    NaN        green
vendor2   option3    small      yellow
vendor2   NaN        medium     green
vendor2   NaN        large      NaN

Проблема в том, что я надеваюНе знаю, сколько продавцов и колонок я получу.Кроме того, некоторые из вставленных данных могут быть NaN, как показано в примере выше.

Есть ли способ использовать панды для создания кадра данных из словаря такого типа?

Буду признателен за любую помощь!

rafaelc · Answer 1 · 22 сентября 2019

Измените это на чистом питоне и используйте несколько панд для окончательных настроек

a = [[x['vendor'], vals[f'col{i+1}_options']] for x in d \
                                              for (i,vals) in enumerate(x['option_list'])]

vendors, data = zip(*a)

pd.DataFrame(data)\
  .groupby(list(vendors))\
  .apply(np.transpose)\
  .reset_index(drop=True, level=1)

               3       4       5
vendor1  option1   small  yellow
vendor1  option2    None   black
vendor1  option3    None   green
vendor2  option3   small  yellow
vendor2     None  medium   green
vendor2     None   large    None

ndclt · Answer 2 · 22 сентября 2019

Я не знаю функцию панды, которая может преобразовать этот тип словаря в нужный словарь.Вы должны создать промежуточный словарь, который можно передать фабрике DataFrame и после их объединения.

Следующий код должен помочь:

dictionary = [{
    'vendor': 'vendor1',
    'option_list': [{
        'col1_name': 'Column1',
        'col1_options': ['option1', 'option2', 'option3']
        }, {
        'col2_name': 'Column2',
        'col2_options': ['small']
        },  {
        'col3_name': 'Column3',
        'col3_options': ['yellow', 'black', 'green']
        }
    ]
},  {
    'vendor': 'vendor2',
    'option_list': [{
        'col1_name': 'Column1',
        'col1_options': ['option3']
        }, {
        'col2_name': 'Column2',
        'col2_options': ['small', 'medium', 'large']
        }, {
        'col3_name': 'Column3',
        'col3_options': ['yellow', 'green']
        }
    ]
}]

to_concat = []
for one_vendor_dict in dictionary:
    new_option_dict = {}
    for option_dict in one_vendor_dict['option_list']:
        column_name, option_value = None, None
        # get column name and column values
        for k, v in option_dict.items():
            if 'name' in k:
                column_name = v
            if 'options' in k:
                option_value = v
        if column_name and option_value:
            new_option_dict[column_name] = option_value

    # put all list to same length in order to build a dataframe.
    max_length = max([len(v) for v in new_option_dict.values()])
    for k, v in new_option_dict.items():
        if len(v) < max_length:
            new_option_dict.update({k: v + [None] * (max_length - len(v))})
    # add the vendor column
    new_option_dict.update({'Vendor': [one_vendor_dict['vendor']] * max_length})
    # create a dataframe for this vendor
    to_concat.append(pd.DataFrame(new_option_dict))
df = pd.concat(to_concat).reset_index(drop=True)

Этот вывод:

   Column1 Column2 Column3   Vendor
0  option1   small  yellow  vendor1
1  option2    None   black  vendor1
2  option3    None   green  vendor1
3  option3   small  yellow  vendor2
4     None  medium   green  vendor2
5     None   large    None  vendor2

Если у вас есть больше столбцов для одного поставщика, функция concat будет заполнена None или NaN при объединении.

Я использую None, потому что опции - это строки, но этокорректно определяется функцией isna при необходимости после.

Ashutosh Parida · Answer 3 · 22 сентября 2019

Попробовал другой подход, используя функцию слияния панд:

import pandas as pd
final_df=pd.DataFrame() # this will have the final data required

# loop thru dictionary and create the dataframe of required columns
for i in range(len(dictionary)):
    df0=pd.DataFrame([dictionary[i]['vendor']],columns=['vendor'])
    df1=pd.DataFrame((dictionary[i]['option_list'][0])['col1_options'],columns=['Column1'])
    df2=pd.DataFrame((dictionary[i]['option_list'][1])['col2_options'],columns=['Column2'])
    df3=pd.DataFrame((dictionary[i]['option_list'][2])['col3_options'],columns=['Column3'])

    # merge the dataframe using outer incase either df is emphasized 
    df_merg1= pd.merge(df1,df2,how='outer',left_index=True,right_index=True)
    df_merg2=pd.merge(df_merg1,df3,how='outer',left_index=True,right_index=True)

    # this needs to be expanded to fit the max 
    df0=pd.concat([df0]*df_merg2.shape[0],ignore_index=True)

    # this will have the required dataframe vendorwise
    df_merg3=pd.merge(df0,df_merg2,how='left',left_index=True,right_index=True)

    #keep concatenating for the final output
    final_df=pd.concat([final_df,df_merg3],axis=0,ignore_index=True)

#print final output
final_df

Использование Pandas для создания DataFrame из сложного словаря / списка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Использование Pandas для создания DataFrame из сложного словаря / списка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов