Какие самые быстрые алгоритмы / API полнотекстового поиска (с открытым исходным кодом или коммерческие)? - PullRequest
5 голосов
/ 21 февраля 2010

Существуют ли какие-либо серебряные пули для поиска средних объемов текстовых данных (сотни гигабайт)? На самом деле все равно, коммерческий он или открытый. Я должен добавить, что мне нужно, чтобы он был основан на C ++ или C.

Ответы [ 3 ]

3 голосов
/ 21 февраля 2010

Apache Lucene - это широко используемый механизм индексации, не уверенный, квалифицируется ли он как серебряная пуля или нет. Я видел это в сочетании с Carrot2 для кластеризации и поиска по индексу.

1 голос
/ 21 февраля 2010

Там также xapian .

0 голосов
/ 07 июля 2012

Solr также может быть вариантом. Это также движок на основе Lucene.

http://lucene.apache.org/solr/

...