Я разработал способ расчета разумных динамических аспектов для ценовых диапазонов продукта. Решение включает в себя некоторую предварительную обработку документов и некоторую последующую обработку результатов запроса, но для него требуется только один запрос к Solr, и он должен даже работать на старой версии Solr, такой как 1.4.
Округлить цены перед отправкой
Сначала, перед отправкой документа, округлите округление цены до ближайшей «границы хорошего круглого фасета» и сохраните ее в поле «округленный_ценой». Пользователям нравится, что их грани выглядят как «250-500», а не «247-483», а округление также означает, что вы получаете сотни ценовых аспектов, а не миллионы. С некоторым усилием следующий код может быть обобщен для хорошего округления при любом ценовом масштабе:
public static decimal RoundPrice(decimal price)
{
if (price < 25)
return Math.Ceiling(price);
else if (price < 100)
return Math.Ceiling(price / 5) * 5;
else if (price < 250)
return Math.Ceiling(price / 10) * 10;
else if (price < 1000)
return Math.Ceiling(price / 25) * 25;
else if (price < 2500)
return Math.Ceiling(price / 100) * 100;
else if (price < 10000)
return Math.Ceiling(price / 250) * 250;
else if (price < 25000)
return Math.Ceiling(price / 1000) * 1000;
else if (price < 100000)
return Math.Ceiling(price / 2500) * 2500;
else
return Math.Ceiling(price / 5000) * 5000;
}
Допустимые цены: 1,2,3, ..., 24,25,30,35, ..., 95,100,110, ..., 240,250,275,300,325, ..., 975,1000 и т. Д.
Получить все грани по округленным ценам
Во-вторых, при отправке запроса запрашивайте все грани по округленным ценам, отсортированным по цене: facet.field=rounded_price
. Благодаря округлению вы получите не более нескольких сотен граней назад.
Объединить смежные грани в более крупные грани
В-третьих, после получения результатов пользователь хочет видеть только от 3 до 7 аспектов, а не сотни аспектов. Итак, объедините смежные грани в несколько больших граней (называемых «сегментами»), пытаясь получить примерно равное количество документов в каждом сегменте. Следующий довольно сложный код делает это, возвращая кортежи (start, end, count), подходящие для выполнения запросов диапазона. Возвращенные значения будут правильными, если цены были округлены до до ближайшей границы:
public static List<Tuple<string, string, int>> CombinePriceFacets(int nSegments, ICollection<KeyValuePair<string, int>> prices)
{
var ranges = new List<Tuple<string, string, int>>();
int productCount = prices.Sum(p => p.Value);
int productsRemaining = productCount;
if (nSegments < 2)
return ranges;
int segmentSize = productCount / nSegments;
string start = "*";
string end = "0";
int count = 0;
int totalCount = 0;
int segmentIdx = 1;
foreach (KeyValuePair<string, int> price in prices)
{
end = price.Key;
count += price.Value;
totalCount += price.Value;
productsRemaining -= price.Value;
if (totalCount >= segmentSize * segmentIdx)
{
ranges.Add(new Tuple<string, string, int>(start, end, count));
start = end;
count = 0;
segmentIdx += 1;
}
if (segmentIdx == nSegments)
{
ranges.Add(new Tuple<string, string, int>(start, "*", count + productsRemaining));
break;
}
}
return ranges;
}
Фильтрация результатов по выбранному фасету
В-четвертых, предположим («250», «500», 38) был один из полученных сегментов. Если пользователь выбирает «250-500 долларов» в качестве фильтра, просто выполните запрос фильтра fq=price:[250 TO 500]