Параметр n_neighbor локального коэффициента выбросов влияет на ROC-AUC - PullRequest
0 голосов
/ 28 сентября 2018

Я пытаюсь решить проблему обнаружения выбросов с помощью нескольких алгоритмов.Когда я использую API локального фактора выброса Scikit-learn, я должен ввести очень важный параметр - n_neighbors.Однако, с другими n_neighbors, я получаю разные ROC_AUC оценки.Например, с n_neighbors=5, затем ROC_AUC=56.Однако с n_neighbors=6 затем ROC_AUC=85n_neighbors=7, затем ROC_AUC=94 и т. д. Формально, ROC_AUC очень высока, если n_neighbors>=6

Я хочу задать три вопроса: (1) Почему параметр n_neighbors в Local Outlier Factor влияетв РПЦ-АУК?(2) Как выбрать подходящий n_neighbors в условиях обучения без учителя?(3) Должен ли я выбрать максимум n_neighbors, чтобы получить максимум ROC_AUC?

1 Ответ

0 голосов
/ 28 сентября 2018

Если результаты не будут затронуты, параметр не понадобится, верно?

Учитывая, что больше соседей более затратно.Но это также означает, что используется больше данных, поэтому я не удивлен, что результаты улучшаются.Вы читали статью, в которой объясняется, что делает параметр?

Когда вы выбираете параметр, основанный на оценке, вы обманываете.Это неконтролируемый метод - вы не должны иметь такие ярлыки в реальном случае использования.

...