У нас есть похожая проблема при попытке свернуть продукты из нескольких торговых каналов. Что мы делаем, так это сворачиваем продукты на основе их бренда (или производителя) + комбо sku.
Наши данные довольно грязные, поэтому нам нужно поработать над тем, чтобы нормализовать как бренд, так и стиль, чтобы продукты хорошо рухнули. У нас есть список брендов, которые нас интересуют, и мы проводим некоторую работу, чтобы отобразить бренды из торговой ленты в наш бренд. например Если в нашей системе есть торговая марка «ACME», мы можем сопоставить следующую марку с этой торговой маркой:
A.C.M.E => ACME
ACME Inc. => ACME
Acme Incorporated => ACME
Для skus мы обычно просто удаляем любые не буквенно-цифровые символы для соответствия. например все последующее будет отображаться в одном и том же sku:
abc-123 => abc123
abc.123 => abc123
abc 123 => abc123
ab.c1.23 => abc123
Так что, если мы увидим бренд "ACME Inc." и sku «abc-123» в одном фиде, который свернется с брендом «A.C.M.E», и sku «abc 123» из другого фида.
В рамках процесса свертывания мы получаем несколько имен / изображений / описаний / категорий / и т. Д. ... для каждой свернутой части и должны выбрать «лучший» для отображения на веб-сайте.
Это очень общий обзор того, как мы справляемся с этим.