Lucene имеет прекрасную возможность пошаговой индексации. Что обычно является болью при разработке ИК системы с нуля
Я хотел бы знать, могу ли я использовать низкоуровневые API Lucene, чтобы использовать его только в качестве инвертированного индекса, то есть хранилища для инвертированных списков, информации о положении, частоты появления терминов, идентификаторов, полей и т. Д. ...
Суть в том, что я хочу реализовать свои собственные взвешивания и оценки документов. Я знаю класс Similarity
, но он не дает той гибкости, которую я хочу.