.agg для группы внутри объекта groupby? - PullRequest
0 голосов
/ 03 августа 2020

Извините, если об этом спрашивали раньше, я не смог его найти.

У меня есть фреймворк данных переписи населения, который содержит население каждого округа в США.

Соответствующая часть df выглядит так:

+----+--------+---------+----------------------------+---------------+
|    | REGION | STNAME  | CTYNAME                    | CENSUS2010POP |
+----+--------+---------+----------------------------+---------------+
| 1  | 3      | Alabama | Autauga County             | 54571         |
+----+--------+---------+----------------------------+---------------+
| 2  | 3      | Alabama | Baldwin County             | 182265        |
+----+--------+---------+----------------------------+---------------+
| 69 | 4      | Alaska  | Aleutians East Borough     | 3141          |
+----+--------+---------+----------------------------+---------------+
| 70 | 4      | Alaska  | Aleutians West Census Area | 5561          |
+----+--------+---------+----------------------------+---------------+

Как я могу получить np.std населения штатов (сумма населения округов) для каждого из четырех регионов США без изменения df?

Ответы [ 2 ]

0 голосов
/ 03 августа 2020

Вы также можете напрямую использовать метод стандартного отклонения std()

 new_df=df.groupby(['REGION'])[['CENSUS2010POP']].std()
0 голосов
/ 03 августа 2020

Вы можете использовать transform:

df['std_col'] = df.groupby('STNAME')['CENSUS2010POP'].transform("std")

IIU C, если вам нужна сумма округов, вы можете:

state_pop = df.groupby('STNAME')['CTYNAME'].nunique().apply(np.std)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...