Какой алгоритм будет полезен для кластеризации и ранжирования блогов в логических сообществах (технологии, развлечения и т. Д.)?
Алгоритм кластеризации и ранжирования сообщений в блоге был бы еще лучше.
Принимаются ответы: алгоритмы, псевдокод, java-код или ссылки на пояснения по конкретным алгоритмам.
Обновление:
Так что, похоже, мне хотелось бы что-то из категории Partions Clustering , основанное, в основном, на текстовых особенностях.