В этой задаче у меня есть набор данных популярных имен детей, начиная с 1880 года. Я пытаюсь найти вневременные популярные имена детей, то есть 30 самых распространенных имен для своего пола в каждом году моих данных.
Я пытался использовать group_by, top_n и filter, но пока еще не очень хорошо разбираюсь в программе, так что неуверен, как здесь происходит правильный порядок и мышление.
library(babynames)
timeless <- babynames %>% group_by(name, sex, year) %>% top_n(30) %>% filter()
Я получаю большую таблицу данных с 30 наиболее распространенными именами для каждого года данных, но я хочу сравнить это, чтобы найти наиболее распространенные имена в каждом году.Мой профессор намекнул, что должно быть четыре вневременных имени мальчика и одно вневременное имя девочки.Любая помощь приветствуется!