У меня есть фрейм данных Spark со столбцами id, категорией, отметкой времени, столбцами цены. Я хочу сгруппировать данные по идентификатору клиента, отсортировать категории по метке времени и получить последние n строк в каждой группе.
Я пробовал приведенный ниже код, но он перенастраивает только 3 строки для общих данных.
a <- data1 %>% dplyr::group_by(customer_id, category) %>% dplyr::arrange(dplyr::desc(timestamp)) %>% head(., n = 3)
предложите эффективное решение