Итак, у меня есть один столбец данных, все данные там нормальные и без каких-либо аномалий. Допустим, данные разбросаны так же, как на картинке ниже.
K-means на самом деле не работает с одним столбцом. Мне дали совет составить график данных, а затем использовать функцию активации, предпочтительно сигмовидную (но могут быть и другие, которые также будут работать), чтобы включить в нее большинство данных.
После этого добавьте аномалии, которые будут подальше от функции активации, а затем, в основном, сказать, находится ли значение так далеко от функции активации (играет роль порога), вызвать это значение как аномалию
Я ищу несколько советов по этому поводу, я думаю, что идея этого не плохая.