У меня есть фрейм данных, который содержит данные об уровнях CO2 во времени и имеет два ключевых столбца: год и промилле.Год идет с 1974 по 2019 год, и есть несколько строк для каждого года.Так, например, 1974 начинается с ppm 333,34, а в следующем ряду - 1974 с ppm немного другой ppm.Всего более 2000 строк.Я хочу получить среднее значение ppm для каждого года и график для каждого отдельного года.
Я пытаюсь найти лучший способ сделать это.Прямо сейчас некоторые вещи, которые я рассмотрел:
df_Year = df.loc[df['Year']==1975]
, который изолировал бы все строки 1975 года, затем использовал бы
df_Year['ppm'].astype("float").mean(axis=0)
, и тогда я мог бы получить среднее значение таким образом, но этовсего один годЯ думаю, что мог бы сделать цикл, который повторяет каждый год и получает среднее значение, а затем назначает среднее значение ppm для списка, словаря или чего-то в этом роде.
Но это кажется довольно продолжительным.Есть ли более эффективный способ?