У меня есть блестящий код, который я пишу как инструмент тестирования / отладки.Он предназначен для проверки результатов нашей аналитики данных, которые все выполняются с помощью dplyr.
У меня есть набор операторов фильтра, для которых я хотел бы отобразить все записи, отфильтрованные по запросу.и обратное значение этого набора (т. е. все записи, которые не были отфильтрованы запросом).
Критерии фильтрации передаются в виде выражений (в списке может быть несколько критериев).
На данный момент лучший способ сделать это - запустить фильтр dplyr, затем просто выбрать столбец первичного ключа из этих данных и затем выполнить анти-объединение с исходными данными.
Это лучший подход для этого?Есть ли лучший способ решения этой проблемы (учитывая вероятное снижение производительности из-за необходимости применения фильтра и объединения, когда набор данных становится большим)?