Я хотел бы создать новый список с элементами из большого вложенного слова.
Вот фрагмент вложенного слова:
AcceptedAnswersPython_combined.json
{
"items": [
{
"answers": [
{
"creation_date": 1533083368,
"is_accepted": false
},
{
"creation_date": 1533083567,
"is_accepted": false
},
{
"creation_date": 1533083754,
"is_accepted": true
},
{
"creation_date": 1533084669,
"is_accepted": false
},
{
"creation_date": 1533089107,
"is_accepted": false
}
],
"creation_date": 1533083248,
"tags": [
"python",
"pandas",
"dataframe"
]
},
{
"answers": [
{
"creation_date": 1533084137,
"is_accepted": true
}
],
"creation_date": 1533083367,
"tags": [
"python",
"binary-search-tree"
]
}
]
}
Новый список должен содержать creation_date
каждогопункт столько раз, сколько есть диктовок в списке answers
.Так что в случае фрагмента кода выше новый список должен выглядеть следующим образом:
question_date_per_answer = [[1533083248, 1533083248, 1533083248 , 1533083248, 1533083248], [1533083367]]
Причина, по которой мне нужен этот новый список, заключается в том, что я хотел бы определить разницу между каждым answers
creation_date
и связанный с ним вопрос creation_date
(изложенный внутри каждого items
dict).
Этот новый список должен выглядеть следующим образом в пандах. Dataframe:
question creation date answer creation date
0 1533083248 1533083368
1 1533083248 1533083567
2 1533083248 1533083754
3 1533083248 1533084669
4 1533083248 1533089107
5 1533083367 1533084137
Я могу перебирать все вопросы примерно так:
items = json.load(open('AcceptedAnswersPython_combined.json'))['items']
question_creation_date = [item['creation_date'] for item in items]
Но это оставляет меня ссписок, который не равен числу answers
creation_date
.
Я не могу разобраться с этим.
Так как мне создать такой список, в котором количество дат создания вопроса равноравно количеству дат создания ответа?(вроде question_date_per_answer
)
Заранее спасибо.