Определение однородности / неоднородности данных с использованием кластеризации - PullRequest
0 голосов
/ 15 сентября 2018

У меня есть последовательные данные (то есть, это приходит по одному экземпляру за раз).Я хочу определить количество накопленных экземпляров (через некоторое время), являются ли они стохастическими (то есть редкими) или однородными (то есть существует некоторая корреляция).

Для этого я используюпоследовательное К-средство.Сначала задаются два центра кластера, и данные последовательно группируются в два класса.Через некоторое время, если я заметил, что данные между двумя кластерами редки, то я говорю, что это стохастик.Однако, если я заметил, что данные в основном накапливаются в одном кластере (например, 70% данных), то я говорю, что данные однородны.

Правильно ли мое мышление?

...