Я проверял схемы кластеризации документов, такие как кластеризация с использованием k-средних , а также иерархическая кластеризация .Вариант использования, для которого я пытаюсь создать кластеры, взят из данных социальных сетей, которые бесконечны и будут поступать непрерывно.
Мне нужно создать автоматические кластеры на основе данных социальных сетей.Когда новое сообщение входит и принадлежит одному из кластеров, оно должно быть присоединено к кластеру, и если не существует кластера, в котором можно разместить новое сообщение, он должен сам создать новый кластер.Как я мог подойти к этому?Какая кластеризация должна охватывать сценарий использования, над которым я пытаюсь работать?Есть ли уроки / примеры для этого?