У меня есть данные, сгруппированные по столбцам буксировки [CustomerID, кластер], например:
CustomerIDClustered.groupby(['CustomerID','cluster']).count()
Count
CustomerID cluster
1893 0 1
1 2
2 5
3 1
2304 2 3
3 1
2655 0 1
2 1
2850 1 1
2 1
3 1
3648 0 1
Мне нужно назначить наиболее частый кластер для идентификатора клиента
Например:
- 1893-> 2 (2 появляются в кластере больше, чем другие кластеры)
- 2304-> 2
- 2655-> 1