Кластер и ранжировать блоги по логическим категориям - PullRequest
1 голос
/ 06 октября 2009

Какой алгоритм будет полезен для кластеризации и ранжирования блогов в логических сообществах (технологии, развлечения и т. Д.)?

Алгоритм кластеризации и ранжирования сообщений в блоге был бы еще лучше.

Принимаются ответы: алгоритмы, псевдокод, java-код или ссылки на пояснения по конкретным алгоритмам.

Обновление: Так что, похоже, мне хотелось бы что-то из категории Partions Clustering , основанное, в основном, на текстовых особенностях.

1 Ответ

1 голос
/ 06 октября 2009

Сначала вы должны лучше определить свою проблему, определив:

  1. Вектор функций (дескриптор) для каждого блога
  2. Метрика для оценки «расстояния» между дескрипторами.

Как только вы это сделаете, у вас будет алгоритмов кластеризации на выбор, таких как kmeans и т. Д.

...