правильные кластеры вручную, чтобы сделать их более актуальными - PullRequest
0 голосов
/ 08 июня 2018

У меня есть кластеры.Они сделаны вручную.Я знаю, что алгоритмы машинного обучения стремятся эффективно сегментировать профили, но я не теряю кластер, который у меня есть.Я просто хочу немного изменить их, чтобы сделать их актуальными.Конечно, результат не будет таким же хорошим, как у K-средних.Знаете ли вы какие-либо методы из существующих кластеров и пытаетесь оптимизировать / исправить их?Большое спасибо

1 Ответ

0 голосов
/ 09 июня 2018

Автоматические кластеры имеют тенденцию быть хуже для всех практических целей, чем все, что вы пометили вручную.

Так что я не думаю, что вам нужно их "оптимизировать".

Но есть несколько очевидных подходов:

  • Для таких методов, как KMeans и PAM, вы можете использовать ваши ручные кластеры в качестве начальных центроидов.Просто убедитесь, что они не ухудшаются ...
  • Существуют алгоритмы кластеризации с ограничениями, в которых вы можете использовать существующие метки в качестве ограничений и заставить алгоритм кластеризации найти решение с наилучшим соглашением.

Но не стоит переоценивать кластеризацию.Он очень чувствителен к параметрам, предварительной обработке, нормализации, ... - он не настолько надежен.

...