Я работаю в системе, которая будет использовать Apache Lucene для анализа и ранжирования группы содержимого веб-страницы из другого источника,
проблема, с которой я столкнулся сейчас, в результате всегда показывает, что группа страниц сначала поступала из одного и того же источника, когда источник имел более 1 страницы с лучшим весом.
это возможно для меня, чтобы использовать lucene option для дальнейшего уточнения результата, поэтому в списке будет отображаться только первое вхождение для источника, а оставшиеся будут перетаскиваться вниз до конца списка результатов, чтобы, по крайней мере, пользователь мог сначала просмотрите другой результат из другого источника, вместо того, чтобы видеть полный список контента из того же источника на первых нескольких страницах ....