Панды добавить все столбец% - PullRequest
0 голосов
/ 21 сентября 2018

Мой текущий фрейм данных выглядит следующим образом:

df0:

reqs    code    hostname    file_path   filename    extension   date
51723330    404 services.compay.com /folderA/folderB/   JPG     2018-09-13 
50927945    404 services.company2.com   /folderA/folderB/   GIF     2018-09-15 
50781228    404 services.companyB.com   /folderA/folderB/   JPG     2018-09-14 
50554338    404 services.companyC.com   /folderA/folderB/...    

Я хотел бы получить такую ​​таблицу, в которой есть столбец с%запросов (% reqs) на основе количества запросов

    reqs    code    hostname    file_path   filename    extension   date        %reqs
    51723330    404 services.compay.com /folderA/folderB/   JPG     2018-09-13  12%
    50927945    404 services.company2.com   /folderA/folderB/   GIF     2018-09-15  10%
    50781228    404 services.companyB.com   /folderA/folderB/   JPG     2018-09-14  11%
    50554338    404 services.companyC.com   /folderA/folderB/...                    10%
...
..
.

Я попытался выполнить это и немного потерял: Процент панд от общего с groupby

df1 = df0.groupby(['code','hostname','file_path','filename','file_extension','date']).agg({'reqs': 'sum'})
df2 = df1.groupby(level=0).apply(lambda x: 100* x/float(x.sum()))

Не похоже, что были представлены%, и я думаю, что мне нужен шаг, когда я получу%, мне нужно объединить его обратно в df0. Это дало некоторые странные результаты.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...