Есть ли способ калибровать c среднее значение для столбца данных для столбца пошагово? - PullRequest
1 голос
/ 13 марта 2020

есть ли способ вызвать c среднее значение столбца df пошагово. Например, у меня есть df с именем data с 50 строками, и я хочу создать график, который показывает среднее значение по оси y и количество выборок по оси x. Поэтому мне нужно знать среднее значение первого значения в моем столбце, затем среднее значение первых двух значений в моем столбце и так далее. Попытка сделать это с выражением лямда, но не удалось.

Есть идеи?

Ответы [ 2 ]

1 голос
/ 13 марта 2020

IIU C, вы можете использовать expanding и mean для совокупного расчета среднего:

пример

data = pd.DataFrame({'col1': np.arange(1, 50)})

data['cumulative_mean'] = data['col1'].expanding().mean()

[out]

    col1  cumulative_mean
0      1              1.0
1      2              1.5
2      3              2.0
3      4              2.5
4      5              3.0
..   ...              ...
44    45             23.0
45    46             23.5
46    47             24.0
47    48             24.5
48    49             25.0

[49 rows x 2 columns]

Для построения графика вы можете использовать:

data.index += 1
data['cumulative_mean'].plot()

enter image description here

0 голосов
/ 13 марта 2020

С прокаткой windows вы можете сделать это очень легко. Вот один пример для 3 значений:

df = pd.DataFrame(columns=['a'], data=np.arange(1,100))
df['a'].rolling(3).mean()

Вы можете изменить размер скользящего окна в l oop. Дополнительную информацию вы можете посмотреть в документах .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...