Существуют ли какие-либо серебряные пули для поиска средних объемов текстовых данных (сотни гигабайт)? На самом деле все равно, коммерческий он или открытый. Я должен добавить, что мне нужно, чтобы он был основан на C ++ или C.
Apache Lucene - это широко используемый механизм индексации, не уверенный, квалифицируется ли он как серебряная пуля или нет. Я видел это в сочетании с Carrot2 для кластеризации и поиска по индексу.
Там также xapian .
Solr также может быть вариантом. Это также движок на основе Lucene.
http://lucene.apache.org/solr/