У меня есть список стран по годам, например:
country year founding_year other_vars
Fake 1900 1950 data
Fake 1901 1950 data
Fake 1902 1950 data
(...)
USE 1900 1901 data
USE 1901 1901 data
USE 1901 1901 data
Поначалу founding_year
немного сбивает с толку, но что делает набор данных, так это то, что он отслеживает страны, которые are countries in 2001
в год - сбор различной статистики по ним.
Нет. Я хочу создать график, показывающий создание / основание наций с течением времени.У меня уже есть переменная year
для оси X, а переменная founding_year
предоставляет необходимую мне информацию - но у меня возникают проблемы с операцией groupby
, чтобы получить number of new nations per founding year
, который я используюследующая команда:
df.groupby(['founding_years', 'country']).size()
Я выбрал переменные founding_year
и country
, чтобы убедиться, что у меня есть уникальные пары (так как в каждой стране несколько строк)
Однако,это дает мне ошибочный результат.
founding_year country
1945 Austria 46
Poland 46
1946 Jordan 46
Lebanon 46
Philippines 46
Syria 16
1947 India 46
Pakistan 25
1948 Israel 46
Myanmar 46
North Korea 46
South Korea 46
Sri Lanka 46
Вместо этого он возвращает количество строк, которые эта нация имеет в базе данных.Команда .count()
дает тот же результат.Я попытался добавить year
в конце функции groupby, но это просто возвращает целую кучу уникальных значений.
Я немного озадачен, вся необходимая мне информация есть, но мне кажется, что я не могу понять, как ее получить - кто-нибудь из вас знает, что мне не хватает?