Обнаружение неконтролируемых выбросов - PullRequest
0 голосов
/ 28 мая 2018

У меня есть 6 точек в каждом ряду и около 20k таких рядов.Каждая из этих точек строк фактически является точками на кривой, характер кривой каждой из строк одинаков (скажем, сигмоидальная кривая или прямая линия и т. Д.).Эти 6 точек могут иметь разные значения x в каждой строке. Я также знаю точку (a, b) для каждой строки, через которую должна пройти эта кривая.Как мне найти строки, которые могут быть аномальными или демонстрировать неожиданное поведение, чем другие строки?Я думал о подгонке кривой, но тогда у меня было только 6 точек для каждой кривой, все, что я знаю, это то, что большинство строк имеют одинаковую природу кривой, поэтому я могу, возможно, сделать общую кривую для всех строк и иметь порог расстояния дляобнаружение выбросов.

1 Ответ

0 голосов
/ 30 мая 2018

Что произойдет, если вы просто обработаете 6 точек как 12-мерный вектор и запустите любой из обычных методов обнаружения выбросов, таких как LOF и LoOP?

Тривиально увидеть взаимосвязь между евклидовым расстоянием на 12мерный вектор и 6 евклидовых расстояний по 6 точек на каждом.Так что это сравнит сходство этих кривых.

Вы, конечно, также можете определить комплексную функцию расстояния для LOF.

...