Развитие кластеров K-мод - PullRequest
0 голосов
/ 30 апреля 2018

После выполнения кластеризации набора данных с использованием k-режимов мне необходимо вовремя развивать кластеры, поэтому есть ли способ автоматической настройки центроидов, пока точки данных изменяют значения своих свойств?

Я имею в виду. Я группирую большой набор данных с категориальными значениями. Тем не менее, эти точки данных меняются во времени (их категориальные значения), поэтому я хочу знать, есть ли какой-либо способ внести коррективы в K-центроиды (или даже в число K), если точки данных слегка изменяются со временем. Я могу пересчитать расстояние от каждой точки данных с помощью центроидов и переместить точку данных в другой кластер, но при этом центроиды будут считаться фиксированными, и я думаю, что они также могут изменяться при изменении точек данных.

Повторная кластеризация является очень тяжелой задачей во времени, поэтому необходимо сделать эти корректировки более эффективным способом. Я ищу литературу, но не нашел никакой информации об этом.

Кто-нибудь знает, возможно ли это или какое-либо исследование, связанное с этим?

1 Ответ

0 голосов
/ 01 мая 2018

Вместо перегруппировки используйте ранее найденные центры.

Они не должны сильно меняться и быстро сходятся.

...