Я занимаюсь изучением старения растений, и у меня есть четыре разные даты измерения. Мое первое измерение (данные ниже) - это эталон, который мне нужен, чтобы остальные три набора данных были равны.
По сути, я оценивал листья в разных точках вегетационного периода по тому, сколько визуального старения они отображали. ,При первом измерении большинство из них на 100% здоровы, и только некоторые из них мертвы. Мне нужно выделить те, которые не равны 100, и использовать эти листья только для моего анализа данных в дальнейшей работе.
Вот первый набор данных:
flowering <- data.frame(plot = c(101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101),
plant=c(1,
1,
1,
1,
1,
1,
1,
1,
1,
2,
2,
2,
2,
2,
2,
2,
2,
2,
2,
2,
3,
3,
3,
3,
3,
3,
3,
3,
3,
3,
3,
4,
4,
4,
4,
4,
4,
4,
4,
4,
4,
5,
5,
5,
5,
5,
5,
5,
5,
5,
5,
5),
leaf.number=c(1,2,3,4,5,6,7,8,9,
1,2,3,4,5,6,7,8,9,10,11,
1,2,3,4,5,6,7,8,9,10,11,
1,2,3,4,5,6,7,8,9,10,
1,2,3,4,5,6,7,8,9,10,11),
score = c(100,
100,
100,
100,
100,
100,
100,
100,
100,
100,
100,
100,
100,
100,
100,
100,
100,
30,
80,
0,
100,
100,
100,
100,
100,
100,
100,
100,
75,
90,
0,
100,
100,
100,
100,
100,
100,
100,
100,
10,
0,
100,
100,
100,
100,
100,
100,
100,
100,
100,
35,
0))
Подмножество набора данных:
flowering_subset <- subset(data, score == 100)
Теперь мы подгруппировали данные. Теперь я хочу, чтобы листья в 'flowering_data' использовались в других наборах данных. Только эти листья должны быть использованы. Следует отметить, что листья были тщательно отмечены, поэтому они были точными, которые я взял в последующих измерениях.
Вот пример моего следующего набора данных:
dough <- data.frame(plot = c(101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101,
101),
plant=c(1,
1,
1,
1,
1,
1,
1,
1,
1,
2,
2,
2,
2,
2,
2,
2,
2,
2,
2,
2,
3,
3,
3,
3,
3,
3,
3,
3,
3,
3,
3,
4,
4,
4,
4,
4,
4,
4,
4,
4,
4,
5,
5,
5,
5,
5,
5,
5,
5,
5,
5,
5),
leaf.number=c(1,2,3,4,5,6,7,8,9,
1,2,3,4,5,6,7,8,9,10,11,
1,2,3,4,5,6,7,8,9,10,11,
1,2,3,4,5,6,7,8,9,10,
1,2,3,4,5,6,7,8,9,10,11),
score = c(100,
100,
100,
90,
100,
100,
100,
90,
100,
100,
90,
100,
100,
90,
80,
80,
80,
30,
80,
0,
100,
100,
100,
100,
100,
100,
80,
80,
75,
90,
0,
100,
100,
100,
100,
80,
80,
80,
80,
10,
0,
100,
100,
100,
100,
100,
90,
90,
90,
90,
35,
0))
Я думал, что dplyr илиТидир будет работать, но если есть другой вариант, это было бы здорово.
Заранее спасибо всем!