Я использую панд, и у меня есть набор данных, который выглядит следующим образом:
ID-cell TOWNS NumberOfCrimes
1 Paris 444
1 Berlin 333
1 London 111
2 Paris 222
2 London 555
2 Berlin 3
3 Paris 999
4 Berlin 777
4 Paris 5
5 Paris 123
5 Berlin 8
6 Paris 1000
9 Berlin 321
12 Berlin 1
12 Berlin 2
12 Paris 1
. . .
И это действительно большой набор данных. Мне нужно оставить для каждого города только 5 строк с наибольшим количеством преступлений и остальные из них удалить.
Итак, мой вывод должен выглядеть так:
ID-cell TOWNS NumberOfCrimes
6 Paris 1000
3 Paris 999
1 Paris 444
2 Paris 222
5 Paris 123
4 Berlin 777
1 Berlin 333
9 Berlin 321
5 Berlin 8
1 London 555
2 London 111
Я действительно ценю помощь. Я новичок в этом. И я работаю над каким-то проектом для факультета, и мой срок так близок. : /