Разница между выбросами и аномалиями и тем, что делает лес выделения - PullRequest
0 голосов
/ 08 апреля 2019

Прежде всего я хочу узнать разницу между аномалией и выбросами.Насколько я могу понять из других определений в Интернете,

Под аномалией понимаются закономерности в данных, которые не соответствуют ожидаемому поведению, тогда как Outlier - это наблюдение, которое отличается от других наблюдений.

Isесть какой-либо статистический способ различения между ними?

Почему я хочу иметь разницу между ними, поскольку я должен решить проблему обнаружения аномалий.

Итак, я увидел 2 алгоритма для обнаружения аномалий, который является лесом изоляциии OneClassSVM.Ниже приведен код и результаты для обоих алгоритмов.Но результаты их обоих выглядят так, будто они обнаруживают выбросы, а не аномалии.

#one class SVM
data = *time series*
scaler = StandardScaler()
np_scaled = scaler.fit_transform(data.values.reshape(-1,1))
data = pd.DataFrame(np_scaled)
model = OneClassSVM(nu=outliers_fraction, kernel="rbf", gamma=0.01)
model.fit(data)

#Isloation Forest
outliers_fraction = 0.01
scaler = StandardScaler()
np_scaled = scaler.fit_transform(data.values.reshape(-1,1))
data = pd.DataFrame(np_scaled)
model =  IsolationForest(contamination=outliers_fraction)
model.fit(data) 

Так используются ли эти алгоритмы для обнаружения аномалий или выбросов?Если это не тот алгоритм, который я могу использовать для обнаружения аномалий?

Я не могу публиковать изображения из-за политики переполнения стека, так что извините за это.

...