Кластеризация документов в Objective-C - PullRequest
1 голос
/ 14 февраля 2011

Я подаю заявку, которая организует набор документов (в количестве от минимум 10 документов до максимум 2000) в группы, основанные на содержании слов / фраз каждого документа.Каждый документ может варьироваться от абзаца слов до примерно полутора страниц.

Я не ищу библиотеку кластеризации документов, которая группирует результаты на основе исходного поискового запроса, но библиотеку, которая группирует безпоисковый запрос.

Существуют ли какие-либо библиотеки, занимающиеся кластеризацией документов, которые можно легко интегрировать в проект Objective-C?

1 Ответ

0 голосов
/ 13 сентября 2011

Я не очень хорошо читаю в Object C, но если вы можете импортировать нативный код C, вы можете использовать эвристику greedyRSC. У нас были очень хорошие результаты для Reuters и LA-Times.

Описание сообщения и C-код доступны здесь: http://research.nii.ac.jp/~meh/greedyRSC/rscpage.html

...