Расчет баллов аномалий для выявления аномалий с использованием SVM One-Class - PullRequest
0 голосов
/ 28 декабря 2018

У меня есть вопрос о расчете баллов аномалии для обнаружения аномалий с использованием SVM One-Class.Мой вопрос заключается в следующем: как я могу рассчитать его с помощью принятия решения_функция (X), точно так же, как я рассчитываю оценку аномалии в лесу изоляции?Большое спасибо,

Ответы [ 2 ]

0 голосов
/ 28 декабря 2018

Да, вы должны использовать decision_function() как показатель аномалии в одном классе SVM.

Посмотрите на этот пример , вы можете лучше понять.

clf.decision_function(X_test)
# returns the signed distance to the separating hyperplane.
# Signed distance is positive for an inlier and negative for an outlier.
0 голосов
/ 28 декабря 2018

В Лесах Изоляции показатель аномалии является мерой отклонения средней длины пути, необходимой для выделения конкретного наблюдения, от средней длины пути, необходимой для выделения «нормального» наблюдения

среднее здесь берется по всем различным деревьям, которые используются.Поскольку SVM не является методом ансамбля - это понятие оценки аномалии не применяется напрямую.

Один способ, и я не знаю, насколько статистически / научно это звучит, для измерения показателя аномалии состоит в построении нескольких классификаторов SVM на основе подмножества предикторов.Затем вы можете использовать процентное отношение случаев, когда конкретная точка классифицируется как выброс, в качестве прокси для оценки аномалии.

...