У меня есть датафрейм с тремя colmuns; название точки данных, номер группы, присвоенный этой точке данных, и виды (данные относятся к животным, а точки данных принадлежат одному из двух видов).
Любая данная строка выглядит следующим образом
Name | Group Number | Species
Data Point A | 3 | 1
Я хотел бы разделить группы только в том случае, если эта группа содержит более 90% только одного вида, например, если группа 3 имеет длину 10 рядов и имеет 9 рядов, относящихся только к виду 1 или виду 2, то она удовлетворяет моим требованиям и должна быть разделенным Я рассмотрел использование функции split
, а также функций filter
из dplyr, но я не могу понять, как заставить r разделить группы с этим требованием, основанным на процентах. Любая помощь будет полезна, спасибо!