Ранее я работал над проектом, в котором мы изучали некоторые социологические данные. Я сделал описательную статистику, и через несколько месяцев меня попросили сделать некоторые графики из статистики.
Я сделал графики, но что-то показалось странным, и когда я сравнил график с числами в отчете, я заметил, что они разные. Проведя дальнейшие исследования, я заметил, что мой код очистки (который удалял участников с двойными идентификаторами) теперь приводит к большему количеству строк, например, больше участников с уникальными идентификаторами, чем ранее. У меня сейчас 730 участников, тогда как раньше было 702, я не знаю, было ли это из-за обновлений некоторых пакетов, и, к сожалению, я не могу опубликовать фактические данные здесь, потому что это конфиденциально, но я пытаюсь выяснить, кто эти 28 участников и что произошло в данных.
Поэтому я хотел бы знать, существует ли метод, который позволяет пользователю фильтровать случаи так, чтобы среднее значение некоторых переменных было заданным числом. В идеале это было бы примерно так, но, конечно, я знаю, что это не сработает в такой форме:
iris %>%
filter_if(mean(.$Petal.Length) == 1.3)
Я знаю, что это была неправильная попытка, но я не знаю другого способа Я бы попробовал это, поэтому я ищу помощь и предложения.