Ваш вопрос о рекомендательных системах. Вы заинтересованы в поиске сходств, которые могут помочь вам дать хорошие рекомендации. Эти сходства могут быть измерены несколькими различными способами. Наиболее распространенным является рассмотрение прошлого поведения людей, купивших на вашем сайте, и поиск сходства между ними. Это можно сделать, используя простую корреляцию среди векторов продуктов . Если у вас есть также данные о людях (возраст, пол) , которые обычно покупают на вашем сайте, вы можете использовать эту информацию для улучшения своей рекомендательной системы. Кроме того, ценная информация предоставляется системой (как и нравится). Помимо корреляции (если вы хотите рассмотреть другие простые меры, но не обязательно статистические), вы также можете использовать евклидово расстояние, расстояние Минковского, косинус угла векторов и так далее ...
Если размер вашего вектора велик, вы можете уменьшить его размерность, включая только важные компоненты. Это можно сделать с помощью PCA (анализ главных компонентов) или Разложение по сингулярным значениям .
Однако, если вы действительно хотите улучшить свою систему, вам следует рассмотреть возможность использования таких классификаторов, как Ближайшие соседи , Деревья решений или , поддерживающие векторные машины и их использование. узнать класс ваших покупателей. Например, это может помочь вам узнать, предпочитает ли данный покупатель дешевые или дорогие бренды ...
Наконец, вы можете проводить онлайн-эксперименты, используя многорукого бандита .
Есть несколько книг, которые могут вам помочь:
1) Рекомендательные системы
2) Алгоритм бандита
3) Машинное обучение