Как кластеризовать данные на основе подмножества атрибутов (4 атрибута)? - PullRequest
0 голосов
/ 21 марта 2019

У меня есть pandas DataFrame, который содержит данные для некоторых объектов, среди которых положение некоторых частей объекта (слева, сверху, справа, снизу).

Например:

ObjectID    Left, Right, Top, Bottom
1            0      0     0      0
2            20    15     5      5
3            3      2     0      0

Как я могу кластеризовать объекты на основе этих 4 атрибутов?Есть ли алгоритм / метод кластеризации, который вы мне порекомендуете?

Ответы [ 2 ]

0 голосов
/ 22 марта 2019

в зависимости от типа данных и конечной цели вы можете попробовать k-means, k-mode или k-prototypes. если ваши данные содержат комбинацию категориальных или непрерывных переменных, тогда вы можете попробовать разделить вокруг алгоритма medoids . Однако, как было указано ранее другим пользователем, не могли бы вы дать больше информации о типе данных и их дисперсии.

0 голосов
/ 21 марта 2019

Почти все алгоритмы кластеризации многомерны и могут быть использованы здесь.Итак, ваш вопрос слишком широкий.

Возможно, стоит сначала посмотреть на соответствующие меры расстояния.

Любая рекомендация будет разумной, поскольку мы не знаем, как ваши данные распределенная .

...