Я загрузил файл .csv в df, и одна из строк столбца содержит список словарей, как показано ниже.
data = [{"character": "Jake Sully", "gender": 2,}, {"character": "Neytiri", "gender": 1},
{"character": "Dr. Grace Augustine","gender": 1},
{"character": "Col. Quaritch", "gender": 2]
Но, конечно, после загрузки он читается как строка.Итак, я преобразовал каждую строку в столбце в json, что облегчает извлечение значений на основе имени ключа.Затем мне нужно создать отдельный df следующим образом.
df = {'character': ['Jake Sully','Neytiri', 'Dr. Grace Augustine', 'Col.Quaritch'],
'gender': [2, 1, 1, 2]}
Это мой код, но я не могу точно получить нужный вывод df.
df = pd.DataFrame() #create new df
keys = ['character','gender'] #keys to extract values from json
lst=[]
for val in data: #to iterate over data series
for object in json.loads(val):
for key in keys:
lst.append(object[key])
df = pd.concat([df,pd.DataFrame(lst,columns=[key])], axis=1)
Может кто-нибудь сказать мнечто я делаю не так?