Представьте, что у меня есть таблица, содержащая информацию о продажах сотрудников.На данный момент меня в основном интересует, сколько продаж / клиентов имеет каждый сотрудник.Меня интересует как общее количество (сколько клиентов было продано сотрудником), так и уникальное количество (сколько уникальных клиентов продано сотруднику).Для этого я просматриваю столбцы Employee_id
и Customer_id
(хотя есть и другие столбцы) в наборе данных Sales
.Они выглядят примерно так:
| Employee_id | Customer_id
1| 'E122' | 'C921' ...
2| 'E122' | 'C221' ...
3| 'E43' | 'C365' ...
4| 'E122' | 'C221' ...
5| 'E57' | 'C138' ...
...
Оба столбца содержат строки для представления идентификаторов.Прямо сейчас у меня есть следующее, но я получаю, что объект 'int' не является вызываемой ошибкой, и я не знаю почему.
Sales.groupby('Employee_id').agg({
'counts': [
('Customer_id', count)
]})
Я не уверен, что я делаю неправильно и где 'int 'ошибка связана с.Обычно я видел функции агрегирования, такие как sum
и max
, но не так сильно, как count
, так что это может быть проблемой.Кроме того, если я хочу также учитывать уникальных клиентов, как бы я это сделал?
Спасибо за вашу помощь!