Как рассчитать среднее значение значений столбца для определенного значения в другом столбце? - PullRequest
0 голосов
/ 19 апреля 2020

У меня есть фрейм данных, который выглядит следующим образом.

enter image description here

Как мне получить среднюю документацию / продолжительность для каждого окна в другом фрейме данных ?

Мне нужно это следующим образом

enter image description here

Кадр данных должен содержать только один столбец, то есть среднее значение. Если есть 3000 windows, то на оси 0 должно быть 3000 строк, представляющих windows, а среднее будет содержать среднее значение. Если это конкретное окно отсутствует в начальном фрейме данных, соответствующее значение для этого окна должно быть 0.

1 Ответ

0 голосов
/ 19 апреля 2020

Используйте метод .groupby(), а затем вычислите среднее значение:

import pandas as pd

df = pd.DataFrame({'10s_windows': [304, 374, 374, 374, 374, 3236, 3237, 3237, 3237],
'doc/duration': [0.1, 0.1, 0.2, 0.2, 0.12, 0.34, 0.32, 0.44, 0.2]})

new_df = df.groupby('10s_windows').mean()


Что приводит к:

Results

Источник: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.groupby.html

...