У меня есть фрейм данных, содержащий столбцы местоположения (loc
), расстояния в пределах местоположения (dist
), значения (cumRate
) и года (year
).
Я хотел бы сравнить показатели расстояний, определить, какое из них выше, и найти год, когда показатели в одной зоне станут выше, чем в другой, как показано ниже (в год 2 расстояние «100» было выше, чем расстояние "нпр")
[![enter code here][1]][1]
Это кажется легким, но я не знаю, с чего начать ... Спасибо за ваши предложения!
Фиктивные данные:
loc = rep(c("a","b"), each = 6)
dist = rep(c("npr", "100", "npr", "100"), each = 3)
cumRate = c(0,0,4,0,1,2,0,0,1,3,5,7)
year = rep(c(1,2,3), 4)
df = data.frame(loc, dist, cumRate, year)
loc dist cumRate year
1 a npr 0 1
2 a npr 0 2
3 a npr 4 3
4 a 100 0 1
5 a 100 1 2
6 a 100 2 3
7 b npr 0 1
8 b npr 0 2
9 b npr 1 3
10 b 100 3 1
11 b 100 5 2
12 b 100 7 3
Данные графика
windows()
ggplot(df, aes(x = year,
y = cumRate,
fill = dist,
colour = dist)) +
geom_line() +
theme_bw() +
facet_grid(.~ loc)
Желаемый вывод
outDf
loc dist year
a 100 2
b 100 1