Я хочу изучить данные о населении, свободно доступные онлайн в https://www.nomisweb.co.uk/api/v01/dataset/NM_31_1.jsonstat.json.Он содержит подробную информацию о населении Великобритании с 1981 по 2017 год. Код, который я использовал до сих пор, ниже
import requests
import json
import pandas
json_url = 'https://www.nomisweb.co.uk/api/v01/dataset/NM_31_1.jsonstat.json'
# download the data
j = requests.get(url=json_url)
# load the json
content = json.loads(j.content)
list(content.keys())
Последняя строка кода выше дает мне следующий вывод:
['version',
'class',
'label',
'source',
'updated',
'value',
'id',
'size',
'role',
'dimension',
'extension']
Iзатем попытался взглянуть на длины 'Value', 'size' и 'role'
print (len(content['value']))
print (len(content['size']))
print (len(content['role']))
И я получил следующие результаты:
22200
5
3
Как мы можемувидеть длины очень разные.Я не могу преобразовать его в фрейм данных, поскольку все они имеют разную длину.Как я могу изменить это на значимый формат, чтобы я мог начать исследовать его?Я должен провести анализ, как показано ниже:
1. Таблица, показывающая численность мужского, женского и общего населения в столбцах, по регионам Великобритании в строках, а также общий показатель по Великобритании за последний год
Исследовательский анализ данных, чтобы показать, как население прогрессировало по регионам и возрастным группам