Я работаю над проблемой, то есть автоматизацией обнаружения выбросов.Для этого мне нужен алгоритм для обнаружения выбросов.
Я читал о z-баллах и интервале между квантилями.Но z-оценка работает только для нормально распределенных данных.И я не уверен насчет интеркантильного диапазона, работает ли он для всех типов данных (даже если он следует гауссову распределению, распределению Пуассона).Я также читал о DBSCAN, но не знаю, насколько правдоподобен этот метод
Любой может предложить мне какой-нибудь алгоритм или пакет в python, который я могу использовать для автоматизации обнаружения выбросов.
IЯ ищу больше алгоритм или даже исследовательскую работу, которую я могу написать на python позже.
Для справки ниже приведен один из примеров данных, в которых я должен найти выброс.
месяц Единиц продано 1 23178,78 2 23547,41 3 17720,51 4 25837,56 5 20375,98 6 16260,64 7 22881,59 8 25202,29 9 17255,29 10 20495,58 11 21253,27 12 20145,73