Расчет балльной оценки аномалии для гистограммного выброса в PYOD - PullRequest
0 голосов
/ 24 октября 2019

Данные У меня проблема с вычислением оценки аномалий с использованием алгоритма оценки выброса на основе гистограммы из библиотеки Python Pyod. Алгоритм, похоже, не рассчитывает истинные оценки. Я на самом деле новичок в этом вопросе.

Мои данные имеют два столбца, но я ищу аномалию только в одном столбце с именем Значения. Другой столбец - столбец идентификатора. Я попытался сначала пометить данные, а затем попытался вычислить оценки аномалий. Я работаю с неконтролируемыми данными, поэтому я не помечаю значения.

from pyod.models.hbos import HBOS
acv = df['Value']
acv_v = acv.values.reshape(-1,1)
random_state = np.random.RandomState(42)


clf = HBOS(contamination=0.5,n_bins=65)
clf.fit(acv_v)
clf_pred = clf.labels_
clf_score = clf.decision_scores_
clf_score = pd.DataFrame(clf_score)
clf_pred = pd.DataFrame(clf_pred)
result = pd.merge(df,clf_pred, how='left', left_index=True,       right_index=True)
final_result = pd.merge(result, clf_score, how='left',left_index=True, right_index=True)
plt.hist(final_result['Value'],bins=50)

Я рассчитываю рассчитать показатель аномалии для каждой точки данных, такой как 2,64, 2,61, ..., 1,09, 0,8 ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...