Самый эффективный способ найти среднее значение для нескольких строк данных с одинаковыми, но меняющимися значениями - PullRequest
0 голосов
/ 25 июня 2019

У меня есть фрейм данных, который содержит данные об уровнях CO2 во времени и имеет два ключевых столбца: год и промилле.Год идет с 1974 по 2019 год, и есть несколько строк для каждого года.Так, например, 1974 начинается с ppm 333,34, а в следующем ряду - 1974 с ppm немного другой ppm.Всего более 2000 строк.Я хочу получить среднее значение ppm для каждого года и график для каждого отдельного года.

Я пытаюсь найти лучший способ сделать это.Прямо сейчас некоторые вещи, которые я рассмотрел:

df_Year = df.loc[df['Year']==1975] 

, который изолировал бы все строки 1975 года, затем использовал бы

df_Year['ppm'].astype("float").mean(axis=0)

, и тогда я мог бы получить среднее значение таким образом, но этовсего один годЯ думаю, что мог бы сделать цикл, который повторяет каждый год и получает среднее значение, а затем назначает среднее значение ppm для списка, словаря или чего-то в этом роде.

Но это кажется довольно продолжительным.Есть ли более эффективный способ?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...