Обучение модели нейронной сети на кластерах KMeans - PullRequest
0 голосов
/ 17 января 2019

Я классифицирую клиентов клиента.Однако данные изменчивы, и кластеры могут меняться каждый день.

Ежедневно запускать новые кластеры для обновления пользовательских кластеров сложно, поскольку Kmeans несовместима с маркировкой кластеров.

Если мы кластеризируем, а затем обучаем данные, скажем, с помощью нейронных сетей или XGBoost и продвигаемся вперед, просто прогнозируем кластеры.Имеет ли это смысл или это хороший способ сделать что-то?

1 Ответ

0 голосов
/ 17 января 2019

Да, это имеет смысл, это просто обычная задача классификации на тот момент. Тем не менее, вы должны иметь достаточно данных, назначенных для кластеров, прежде чем переходить к нейронной сети.

С другой стороны, почему бы вам не предсказать кластеры для новых точек вместо их обновления (вы можете увидеть отдельные методы для подгонки и прогнозирования в документах sklearn , хотя это зависит от технологии, которую вы используете )? Помните, что нейронная сеть будет только настолько хороша, насколько ее ввод (кластеры K-средних), и ее предсказания, вероятно, будут аналогичны K-средним.

Кроме того, НС сложнее и сложнее в обучении, возможно, они не должны быть вашим первым выбором.

Вы также можете проверить идею нечеткой кластеризации, так как данные текучие, они могут лучше подойти для вашего случая. Может быть, автоэнкодеры, как метод получения скрытых переменных, также могут быть полезны.

...