У меня есть основной фрейм данных (data
), который содержит информацию о покупках: имена, год, город и несколько других переменных:
Name Year City
N1 2018 NY
N2 2019 SF
N2 2018 SF
N1 2010 NY
N3 2020 AA
Я использовал new_data <- data %>% group by(Name) %>% tally(name = "Count")
, чтобы получить что-то вроде это:
Name Count
N1 2
N2 2
N3 1
Мои вопросы, желательно с использованием dplyr:
1) Как мне теперь добавить город, соответствующий названию, в new_data
, например:
Name Count City
N1 2 NY
N2 2 SF
N3 1 AA
2) Как добавить самый ранний год каждого Имени в new_data, например:
Name Count City Year
N1 2 NY 2010
N2 2 SF 2018
N3 1 AA 2020