Как автоматически ограничить представление в rpivottable для защиты данных - PullRequest
0 голосов
/ 16 января 2019

Я запускаю проект на всю жизнь клиента и хочу поделиться тем, как данные выглядят с бизнесом, так как я хочу иметь возможность идентифицировать важные переменные с ними. Я планирую сделать это с помощью отличного пакета rpivottable и запустить блестящее приложение, чтобы увидеть, где существуют базовые различия в группах для выбора моих функций.
Это означало бы, что у меня есть моя клиентская база в 4 миллиона клиентов, и я нарезаю их на кусочки несколькими способами.

Однако, следуя GDPR, мы должны убедиться, что ни одна группа не имеет менее 7 клиентов. Поэтому мне нужен некоторый фоновый расчет, чтобы никогда не показывать менее 7 клиентов.

Если я логически думаю об этом, то единственный способ увидеть, как он работает, - это внести изменения в сводную таблицу, использовать кнопку формы отправки, чтобы можно было рассчитать размер групп, и затем фильтр ( который должен быть скрыт от пользователя, чтобы его нельзя было отключить).

Я знаю, что должен предоставить код, но я не знаю, с чего начать. Кто-нибудь имел подобные проблемы и имеет потенциальное решение для всей или части проблемы? Кто-нибудь встроил скрытый фильтр в свой rpivottable? Кто-нибудь смог ограничить их вывод только 90% своих данных?

Спасибо
J

1 Ответ

0 голосов
/ 16 января 2019

Чтобы быть абсолютно уверенным, вам нужно загрузить фрейм данных, который выглядит как «dim, dim, dim, count», где count всегда больше 7. В основном, просто небольшая предварительная обработка ваших входных данных. К сожалению, это означает, что вы будете ограничены небольшим количеством грубых измерений, иначе вы в конечном итоге отфильтруете все.

...