Используйте гауссиан в каждом измерении данных, чтобы определить, что является аномалией. Среднее значение и дисперсия отклоняются для каждого измерения, и если значение нового элемента данных в этом измерении ниже порогового значения, оно считается выбросом. Это создает один гауссов на измерение. Вы можете использовать здесь некоторые функции, а не просто подгонять гауссианов к необработанным данным.
Если объекты выглядят не по-гауссовски (построите их гистограмму), используйте преобразования данных, такие как log (x) или sqrt (x), чтобы изменить их, пока они не будут выглядеть лучше.
Используйте обнаружение аномалий, если контролируемое обучение недоступно, или если вы хотите найти новые, ранее невидимые аномалии (например, отказ силовой установки или кого-то, кто действует подозрительно, а не мужчина или женщина)
Анализ ошибок: однако, что если p (x), вероятность того, что пример не является аномалией, велика для всех примеров? Добавьте другое измерение, и надеюсь, что это поможет показать аномалию. Вы можете создать это измерение, комбинируя некоторые другие.
Чтобы немного больше подогнать гауссов к форме ваших данных, вы можете сделать их многомерными. Затем он принимает матричное среднее и дисперсию, и вы можете изменять параметры, чтобы изменить его форму. Он также покажет корреляции функций, если ваши функции не все независимы.
https://stats.stackexchange.com/questions/368618/multivariate-gaussian-distribution