У меня есть кадр данных, показанный ниже. Он отсортирован так, что «POP» находится в порядке убывания по отношению к каждому «STATE». Теперь я хочу суммировать три самых больших значения «POP» в отношении каждого «СОСТОЯНИЯ», как мне это сделать?
import pandas as pd
d = [['X','q',123383],['X','w',43857349],['X','e',236657],['X','r',23574594],
['Y','t',547853],['Y','y',46282134],['Y','u',43857439],['Y','i',32654893],['Y','i',95678312]]
df = pd.DataFrame(d, columns = ['STATE','COUNTY','POP'])
df.sort_values(['STATE','POP'], ascending=[True, False]).set_index(['STATE','COUNTY'])
print(sorted_df)
# sorted_df:
POP
STATE COUNTY
X w 43857349
r 23574594
e 236657
q 123383
Y i 95678312
y 46282134
u 43857439
i 32654893
t 547853