библиотека кластеризации терминов? - PullRequest
3 голосов
/ 24 декабря 2009

Кто-нибудь знает библиотеку с открытым исходным кодом, которая использует термин кластеризация?

Спасибо, Янов

Ответы [ 5 ]

5 голосов
/ 24 декабря 2009

Apache Mahout предоставляет алгоритмы для кластеризации.

1 голос
/ 22 сентября 2011

WEKA имеет целый набор инструментов для обработки текста и кластеризации.

1 голос
/ 05 мая 2010

Оформить заказ NLTK . Есть несколько кластеризованных модулей, которые могут работать на вас.

0 голосов
/ 26 мая 2014

Python Scikit learn имеет несколько специальных пакетов для анализа текста . Кроме того, они имеют полный набор алгоритмов кластеризации, который включает K-средних , AP , Среднее смещение , Спектральная кластеризация , Алгоритмы иерархической кластеризации и DBSCAN (с соответствующими метриками оценки ). Это может быть полезно для вашей задачи кластеризации термина.

Ссылка на Scikit Узнайте последние видео-учебник

Ссылка на Книга Scikit Learn

0 голосов
/ 17 ноября 2012

Если у вас в Python есть NLTK, как уже упоминалось его автором, но есть и sklearn , который обеспечивает гораздо больше, чем просто кластеризацию. ( Ссылка приводит вас к соответствующим текстовым примерам).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...