После некоторых манипуляций с данными и использования сводной таблицы я смог достичь желаемого результата:
domain code count
a.com 200 10
502 5
404 8
c.com 200 31
502 9
503 15
b.com 200 5
404 2
503 1
d.com 200 47
404 22
Моя цель теперь состоит в том, чтобы суммировать количество для каждого домена и отсортировать домены в порядке убывания которые подсчитываются следующим образом:
domain code count
d.com 200 47
404 22
c.com 200 31
502 9
503 15
a.com 200 10
502 5
404 8
b.com 200 5
404 2
503 1
Если я делаю d.groupby('domain').sum()
, я просто получаю домены и сумму подсчета, но я не хочу представлять сумму, она нужна просто для сортировки.
Дополнительно я хотел бы добавить процент для каждого кода относительно каждого домена, например:
domain code count %
d.com 200 47 68,115942029
404 22 31,884057971
c.com 200 31 56,363636363
502 9 16,363636363
503 15 27,272727272
a.com 200 10 etc...
502 5
404 8
b.com 200 5
404 2
503 1