Есть ли какой-нибудь метод для обнаружения выбросов в ненормально распределенных данных? - PullRequest
0 голосов
/ 05 апреля 2019

Я работаю над автоматизацией анализа временных рядов.В этом я должен автоматизировать процесс обнаружения выбросов в разных временных рядах.Таким образом, мои данные могут быть нормально распределенными или не нормально распределенными.

Я знаю тест grubb и блок-график, который можно использовать для обнаружения выбросов, но он должен быть для нормальных распределенных данных

1 Ответ

0 голосов
/ 05 апреля 2019

Если у вас есть эмпирическое распределение, вы можете вычислить квантили (например, 0,025 и 0,975) для этого распределения. Тогда значения, выходящие за пределы квантилей, можно обозначить как выбросы. Осторожно, это будет полезно только для распределений, имеющих форму колокола (не как экспоненциальный).

В других случаях вам следует опасаться монахинь каждого распределения, например, в экспоненте или пуассоне вы должны смотреть только на правую часть.

Для получения дополнительных ответов, https://stats.stackexchange.com/questions/129274/outlier-detection-on-skewed-distributions

...