Кластеризация текста из социальных сетей - PullRequest
0 голосов
/ 12 июня 2018

Я проверял схемы кластеризации документов, такие как кластеризация с использованием k-средних , а также иерархическая кластеризация .Вариант использования, для которого я пытаюсь создать кластеры, взят из данных социальных сетей, которые бесконечны и будут поступать непрерывно.

Мне нужно создать автоматические кластеры на основе данных социальных сетей.Когда новое сообщение входит и принадлежит одному из кластеров, оно должно быть присоединено к кластеру, и если не существует кластера, в котором можно разместить новое сообщение, он должен сам создать новый кластер.Как я мог подойти к этому?Какая кластеризация должна охватывать сценарий использования, над которым я пытаюсь работать?Есть ли уроки / примеры для этого?

1 Ответ

0 голосов
/ 14 июня 2018

Вам нужен сетевой потоковый кластер.

Они существуют, но я не думаю, что они работают хорошо.

...