Анализ данных с помощью панд - PullRequest
0 голосов
/ 08 июня 2018

Я новичок в области науки о данных.Я пытаюсь выполнить агрегацию данных, но не знаю, как их кодировать.У меня есть следующий фрейм данных.Мне нужно знать, как я могу рассчитать общее количество заданий, выполненных водителем (идентификатор водителя уникален)

image image

df = data.groupby(['dr_status','No_of_jobs']).size()

Как настроить, чтобы я могувидеть вывод, подобный следующему?

Diver_ID -  Total_Jobs

53028  - 45

53051  - 20 

1 Ответ

0 голосов
/ 08 июня 2018

sum No_of_jobs и groupby идентификатор драйвера должен выполнять работу

data.groupby('Driver_Id')['No_of_jobs'].sum()

другой вариант - pivot_table с aggfunc=['count']:

df.pivot_table(values=['No_of_jobs'],index='Driver_Id',aggfunc=['count'])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...