У меня есть pandas dataframe df
с источником, местом назначения и стоимостью, чтобы добраться от источника до места назначения.
SRCLAT SRCLONG DESTLAT DESTLONG PRICE
43.5 47.5 103.5 104 50
43.5 47.5 103.5 104 100
43.5 47.5 103.5 104 100
43.5 30 90 80 300
43.5 30 90 80 400
90 80
Я пытаюсь сделать ранжирование цен в процентилях, где верхний процентиль является самой низкой ценой для строк с одинаковыми координатами от источника до пункта назначения, игнорируя nans
Мой желаемый вывод:
SRCLAT SRCLONG DESTLAT DESTLONG PRICE PERCENTILE
43.5 47.5 103.5 104 50 100% (best price out of 3)
43.5 47.5 103.5 104 100 67% (tied for 2nd out of 3)
43.5 47.5 103.5 104 100 67% (tied for 2nd out of 3)
43.5 30 90 80 300 100% (best out of 2)
43.5 30 90 80 400 50% (worst out of 2)
90 80
Как бы я это сделал?
Я пытался сгруппировать 4 столбца с помощью
df.groupby([SRCLAT, SRCLONG, DESTLAT, DESTLONG)].size()
чтобы получить размеры каждой уникальной группы, но я не знаю, куда идти.