Я хочу объединить данные транзакции клиента в одну строку для каждого клиента, используя dplyr. Для непрерывных переменных это просто - используйте сумму / среднее и т. Д. Для категориальных переменных я хотел бы выбрать «Режим», то есть наиболее часто встречающееся значение в группе, и сделать это в нескольких столбцах, например ::100100
Например взять таблицу Cus1
Cus <- data.frame(Customer = c("C-01", "C-01", "C-02", "C-02", "C-02", "C-02", "C-03", "C-03"),
Product = c("COKE", "COKE", "FRIES", "SHAKE", "BURGER", "BURGER", "CHICKEN", "FISH"),
Store = c("NYC", "NYC", "Chicago", "Chicago", "Detroit", "Detroit", "LA", "San Fran")
)
И сгенерировать таблицу Cus_Summary:
Cus_Summary <- data.frame(Customer = c("C-01", "C-02", "C-03"),
Product = c("COKE", "BURGER", "CHICKEN"),
Store = c("NYC", "Chicago", "LA")
)
Есть ли пакеты, которые могут предоставить эту функцию? Или есть кто-нибудь функция, которая может быть применена к нескольким столбцам в шаге dplyr?
Меня не беспокоят умные способы обработки связей - любого вывода для связи будет достаточно (хотя любые предложения относительно того, как лучше всего обрабатывать связи, были бы интересны и оценены).