Моей основной целью является подмножество набора данных и суммирование с новыми столбцами, которые используют функцию задержки. Я понимаю, как подмножество и набор данных, но я пытаюсь завершить использование функции задержки в моем наборе данных, и это доставляет мне проблемы.
Я уже пробовал несколько разных способов его реализации, но безуспешно.
gapminder %>%
na.omit() %>%
group_by(country) %>%
summarise(prevPeriod = lag(year),
lifeExpGrowth = lag(lifeExp),
popGrowth = lag(pop),
gdppcGrowth = 100*(gdpPercap/lag(gdpPercap) - 1)))
В настоящее время я получаю код для запуска с лагом в зависимости от страны, а не года. gdppcGrowth также должен возвращать проценты, и я получаю сообщение об ошибке;
Column `gdppcGrowth` must be length 1 (a summary value), not 12
Для каждой функции я хочу проанализировать данные по странам, ориентируясь на темпы роста. Я хочу использовать функцию lag (x) для доступа к предыдущему значению серии или вектора, чтобы 100 * (x / lag (x) - 1) вычисляло стандартные (арифметические) скорости роста x, выраженные в процентах.