Насколько я знаю, такого пакета нет.Кажется, то, что вы просите, очень специализировано.Я думаю, что вы действительно ищете аномалии или выбросы.Хотя было бы здорово иметь какую-то вещь, которая бы регрессировала все переменные в других и искала потенциальные экстремальные выбросы (вероятно, не так уж сложно сделать)
2 мысли:
1) график рассеянияпеременные, которые вы будете указывать, такие как возраст и доход.Даже при 100 тыс. Строк эта (1 год в возрасте 50 тыс.) Выскочит далеко от всех остальных.
2) Выполнение регрессии и просмотр графика модели.Там есть довольно хорошее обнаружение выброса.
3) Поиск среди стандартизированных остатков и поиск значений выше 2 или, скорее всего, 3 sd, с помощью которых указатель, который индексирует номера наблюдений данных.
Что-то вроде: dataframe[which(rstandard(model)>3), ]