Среднее значение для объекта DataFrame pandas, включая статистическую значимость после группового - PullRequest
0 голосов
/ 22 марта 2019

Представьте, что у меня есть эти панды DataFrame:

  Class Val
0     A   1
1     B   1
2     B   1
3     B   1
4     B   0

И я хочу сделать среднее значение значений, сгруппированных по Class, НО, имея в виду статистическую значимость значений так,если у B было много Val, равного 1, то результирующее значение среднего значения B преодолеет результирующее значение среднего значения A, поскольку оно имеет только одно наблюдение.

1 Ответ

0 голосов
/ 22 марта 2019

Использование:

import pandas as pd

df = pd.DataFrame({'Class': ['A', 'B', 'B', 'B', 'B'], 'Val': [1, 1, 1, 1, 0]})
print(df.groupby('Class').agg(['mean', 'count']))

Вам нужно будет больше узнать о том, как вы решите, какой использовать, но это дает вам основную информацию, необходимую для этого.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...