Прежде всего я хочу узнать разницу между аномалией и выбросами.Насколько я могу понять из других определений в Интернете,
Под аномалией понимаются закономерности в данных, которые не соответствуют ожидаемому поведению, тогда как Outlier - это наблюдение, которое отличается от других наблюдений.
Isесть какой-либо статистический способ различения между ними?
Почему я хочу иметь разницу между ними, поскольку я должен решить проблему обнаружения аномалий.
Итак, я увидел 2 алгоритма для обнаружения аномалий, который является лесом изоляциии OneClassSVM.Ниже приведен код и результаты для обоих алгоритмов.Но результаты их обоих выглядят так, будто они обнаруживают выбросы, а не аномалии.
#one class SVM
data = *time series*
scaler = StandardScaler()
np_scaled = scaler.fit_transform(data.values.reshape(-1,1))
data = pd.DataFrame(np_scaled)
model = OneClassSVM(nu=outliers_fraction, kernel="rbf", gamma=0.01)
model.fit(data)
#Isloation Forest
outliers_fraction = 0.01
scaler = StandardScaler()
np_scaled = scaler.fit_transform(data.values.reshape(-1,1))
data = pd.DataFrame(np_scaled)
model = IsolationForest(contamination=outliers_fraction)
model.fit(data)
Так используются ли эти алгоритмы для обнаружения аномалий или выбросов?Если это не тот алгоритм, который я могу использовать для обнаружения аномалий?
Я не могу публиковать изображения из-за политики переполнения стека, так что извините за это.