У меня есть набор данных, который выложен аналогично примеру ниже:
variable value flag
A 6.1
A 7.0
A 3.3 x
A 5.2
A 9.5
B 1.1
B 1.0 x
B 1.0 x
B 3.4
B 1.0 x
C 20
C 35
C 17
C 24
C 12
Что я хочу сделать, это удалить все записи фактора из столбца переменной, если количество записей БЕЗ «x» в столбце флага меньше 3.
Для данных выше, желаемый выход ниже. Все записи фактора B были удалены, поскольку в столбце флага было только две записи без «x».
variable value flag
A 6.1
A 7.0
A 3.3 x
A 5.2
A 9.5
C 20
C 35
C 17
C 24
C 12
Порог (3 в приведенном выше примере) должен быть жестко задан.
У меня также есть немного кода, который удаляет все записи для факторов, которые имеют менее 6 записей, но не могли понять, как адаптировать его для того, что мне нужно.
df <- df %>%
group_by(variable) %>%
filter(n() > 5)
Спасибо!