Мой анализ вашего вопроса таков:
for each item in feed:
calculate term frequency of item, then add to feed's frequency list
Это не то, в чем Lucene преуспевает, поэтому CouchDB или другой db может быть таким же хорошим, если не лучшим выбором (как предлагает larsmans).Тем не менее, это может быть сделано (таким образом, что это, вероятно, немного проще, чем другие БД):
HashMap<string, int> terms = new HashMap<string, int>(indexReader.getUniqueTermCount());
TermEnum tEnum = indexReader.Terms();
while (tEnum.Next())
{
results.Add(tEnum.Term().Text(), tEnum.DocFreq());
}
Все, что Lucene экономит вам, это сложность вычисления docfreq, и, вероятно, это будет немного быстреечем перебирать все ряды самостоятельно.Но я был бы удивлен, заметна ли разница в производительности для достаточно небольших наборов данных.