Это и искусство, и наука. Типичные области исследования вращаются вокруг анализа корзины рынка (также называемого анализом сродства), который является подмножеством области интеллектуального анализа данных. Типичные компоненты в такой системе включают в себя идентификацию первичных элементов драйвера и идентификацию сходных элементов (дополнительное оборудование, перекрестная продажа).
Имейте в виду источники данных, которые они должны добывать ...
- Приобретенные корзины покупок = реальные деньги от реальных людей, потраченные на реальные товары = мощные данные и многое из этого.
- Товары добавлены в корзину, но заброшены.
- Эксперименты по ценообразованию онлайн (A / B-тестирование и т. Д.), В которых они предлагают одни и те же продукты по разным ценам и видят результаты
- Эксперименты по упаковке (A / B-тестирование и т. Д.), В которых они предлагают разные продукты в разных «связках» или скидку на различные пары предметов
- Списки пожеланий - что на них написано специально для вас - и в совокупности их можно обрабатывать аналогично другому потоку данных анализа корзины
- Реферальные сайты (идентификация того, откуда вы пришли, может подсказать другие интересующие вас предметы)
- Время задержки (как долго, прежде чем вы нажмете назад и выберите другой предмет)
- Рейтинги, сделанные вами или теми, кто находится в вашей социальной сети / кругах покупателей - если вы оцениваете понравившиеся вам вещи, вы получаете больше того, что вам нравится, и если вы подтверждаете нажатием кнопки «У меня уже есть это», они создают очень полный профиль вас.
- Демографическая информация (ваш адрес доставки и т. Д.) - они знают, что популярно в вашем регионе для ваших детей, вас, вашего супруга и т. Д.
- Сегментация пользователя = Вы купили 3 книги в отдельные месяцы для малыша? скорее всего есть ребенок или больше .. и т. д.
- Прямой маркетинг кликает по данным - вы получили от них электронное письмо и кликнули? Они знают, какое это было электронное письмо, на что вы нажали и купили ли вы его в результате.
- Нажмите пути в сеансе - что вы просматривали независимо от того, вошли ли они в вашу корзину
- Количество просмотров товара до окончательной покупки
- Если вы имеете дело с магазином кирпичей и растворов, у них также может быть история ваших физических покупок (например, игрушки или что-то в Интернете, а также физический магазин)
- и т.д.. и т. д.
К счастью, люди ведут себя одинаково в совокупности, поэтому, чем больше они знают о покупательском населении в целом, тем лучше они знают, что будут продаваться, а что нет, и с каждой транзакцией и каждым рейтингом / списком пожеланий добавляют / просматривают, что они знают, как более индивидуально настроить рекомендации. Имейте в виду, что это всего лишь небольшая выборка из всего набора влияний того, что заканчивается рекомендациями и т. Д.
Теперь у меня нет внутренних знаний о том, как Amazon ведет бизнес (там никогда не работал), и все, что я делаю, это говорю о классических подходах к проблеме онлайн-торговли - раньше я был премьер-министром, который работал над анализом данных и аналитикой. для продукта Microsoft под названием Commerce Server. Мы поставили на Commerce Server инструменты, позволяющие людям создавать сайты с похожими возможностями ... но чем больше объем продаж, тем лучше данные, тем лучше модель - и Amazon БОЛЬШОЙ. Я могу только представить, как весело играть с моделями с таким большим количеством данных на коммерческом сайте. Теперь многие из этих алгоритмов (например, предиктор, который был запущен на коммерческом сервере) перешли на прямую жизнь в Microsoft SQL .
Вы должны иметь четыре основных варианта:
- Amazon (или любой розничный продавец) просматривает сводные данные по тоннам транзакций и тоннам людей ... это позволяет им даже очень неплохо рекомендовать анонимных пользователей на своем сайте.
- Amazon (или любой изощренный розничный продавец) отслеживает поведение и покупки любого, кто вошел в систему, и использует его для дальнейшего уточнения данных массового агрегирования.
- Часто есть средства перебора накопленных данных и получения «редакционного» контроля над предложениями для менеджеров по продуктам определенных линий (например, некоторых людей, которые владеют вертикалью «цифровых камер» или вертикалью «романсов» и т. П.) где они действительно эксперты
- Часто бывают рекламные предложения (например, Sony, Panasonic, Nikon, Canon, Sprint или Verizon платят розничному продавцу дополнительные деньги или дают лучшую скидку при больших количествах или других вещах в этих строках), которые вызывают определенные «предложения». чтобы подняться на вершину чаще, чем другие - для этого всегда есть какая-то разумная бизнес-логика и бизнес-причина, нацеленные на увеличение прибыли на каждую транзакцию или сокращение оптовых затрат и т. д.
С точки зрения фактической реализации? Почти все крупные онлайн-системы сводятся к некоторому набору конвейеров (или реализации шаблонов фильтров, или рабочих процессов и т. Д., Вы называете это так, как хотите), которые позволяют оценивать контекст с помощью ряда модулей, которые применяют некоторую форму бизнес логика.
Как правило, с каждой отдельной задачей на странице ассоциируется другой конвейер - у вас может быть тот, который рекомендует «пакеты / апселлы» (т. Е. Купить его с товаром, на который вы смотрите), и тот, который делает «альтернативы» (т. е. купить это вместо того, на что вы смотрите) и другое, которое выбирает предметы, наиболее тесно связанные с вашим списком пожеланий (по категориям товаров или аналогичным).
Результаты этих конвейеров могут быть размещены в различных частях страницы (над полосой прокрутки, под прокруткой, слева, справа, разными шрифтами, изображениями разного размера и т. Д.) И проверены на Посмотрите, какие из них работают лучше всего. Поскольку вы используете удобные модули plug-and-play, которые определяют бизнес-логику для этих конвейеров, вы получаете моральный эквивалент блоков lego, которые позволяют легко выбирать и выбирать бизнес-логику, которую вы хотите применять при создании другого конвейера. что позволяет быстрее инноваций, больше экспериментов, и, в конечном итоге, более высокую прибыль.
Это помогло вообще? Надеюсь, это даст вам некоторое представление о том, как это работает в целом для любого сайта электронной коммерции - не только для Amazon. Amazon (от общения с друзьями, которые там работали) очень ориентирован на данные и постоянно измеряет эффективность пользовательского опыта, цен, продвижения, упаковки и т. Д. - он очень сложный розничный продавец в Интернете и, вероятно, находится на переднем крае множество алгоритмов, которые они используют для оптимизации прибыли - и это, вероятно, собственные секреты (вы знаете, как формула для секретных специй KFC) и охраняются как таковые.