У меня есть датафрейм для панд:
df = pd.DataFrame({"RT":[9,10,10,11,11,11,11],"Quality":[70,60,50,60,80,70,80],'Name' :['a','a','b','c','b','c','b'],'Similarity':[0.98,0.97,0.97,0.95,0.95,0.95,0.95]})
RT Quality Name Similarity
0 9 70 a 0.98
1 10 60 a 0.97
2 10 50 b 0.97
3 11 60 c 0.95
4 11 80 b 0.95
5 11 70 c 0.95
6 11 80 b 0.95
Значения в столбце Similarity
совпадают по группам со столбцом RT
Я хочу сгруппировать столбец RT
и найти максимальное значение столбца Quality
и сгруппировать по столбцу Name
.
Например:
В столбце RT
значение 11
, в котором есть столбец Name
, значение c
и b
, суммировать каждое из значений Quality
столбца, затем получить c = 130, b =160
и отсортировать максимальное значение 160, b
тогда получите
RT Quality Name Similarity
0 9 70 a 0.98
1 10 60 a 0.97
2 10 50 b 0.97
3 11 160 b 0.95
4 11 130 c 0.95