Question

Есть ли эффективный способ кластеризации текстовых документов?Я думал о K-Means, но это кажется слишком трудоемким.Может ли кто-нибудь предоставить мне эффективный метод?

Mike Dunlavey · Answer 1 · 24 декабря 2010

Если K-Means действительно выполняет свою работу и просто кажется медленной, то почему бы не попытаться сделать это быстрее? Я использую метод случайная пауза .

Обычно бывает так, что есть много возможностей для ускорения, в коде, который вы не считали бы проблемой, без изменения базового алгоритма. Вот пример.

Radi · Answer 2 · 24 декабря 2010

алгоритм кластеризации зависит от вашего набора данных, вы хотите написать алгоритм в java для кластеризации ваших документов?, вы можете использовать weka вместо того, чтобы заново изобретать колесо и попробовать другой алгоритм кластеризации в вашем наборе данных.

Кластер тысячи текстовых документов в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Кластер тысячи текстовых документов в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы