Сгруппировать по + Совокупность + Количество в Панда - PullRequest
0 голосов
/ 10 октября 2018

Представьте, что у меня есть таблица, содержащая информацию о продажах сотрудников.На данный момент меня в основном интересует, сколько продаж / клиентов имеет каждый сотрудник.Меня интересует как общее количество (сколько клиентов было продано сотрудником), так и уникальное количество (сколько уникальных клиентов продано сотруднику).Для этого я просматриваю столбцы Employee_id и Customer_id (хотя есть и другие столбцы) в наборе данных Sales.Они выглядят примерно так:

  | Employee_id | Customer_id
 1|      'E122' |      'C921' ...
 2|      'E122' |      'C221' ...
 3|      'E43'  |      'C365' ...
 4|      'E122' |      'C221' ...
 5|      'E57'  |      'C138' ...
 ...

Оба столбца содержат строки для представления идентификаторов.Прямо сейчас у меня есть следующее, но я получаю, что объект 'int' не является вызываемой ошибкой, и я не знаю почему.

Sales.groupby('Employee_id').agg({
'counts': [
    ('Customer_id', count)
]})

Я не уверен, что я делаю неправильно и где 'int 'ошибка связана с.Обычно я видел функции агрегирования, такие как sum и max, но не так сильно, как count, так что это может быть проблемой.Кроме того, если я хочу также учитывать уникальных клиентов, как бы я это сделал?

Спасибо за вашу помощь!

...