Создать кластеризацию продуктов на основе мнений клиентов - PullRequest
0 голосов
/ 06 февраля 2019

У меня есть 1 миллион строк:на совокупности шаблонов просмотра клиентов.Как мне это сделать?

Еще один шаг, который я предпринял, - это загрузить эти данные в Elasticsearch и выполнить запрос значительное_терм по отношению к представлениям клиентов, используя каждый из моих идентификаторов продукта.Затем я возвращаю 10 продуктов для каждого продукта, которые, скорее всего, будут просмотрены вместе, вместе с оценкой.Мое конечное желание состоит в том, чтобы иметь возможность кластеризовать данные этого продукта таким образом, чтобы разграничить различные «индивидуальные» типы или интересы.

Может ли графическая база данных, подобная neo4j, помочь здесь или какой-то другой алгоритм кластеризации?

1 Ответ

0 голосов
/ 06 февраля 2019

Кластеризация - неправильный подход.

Нет никаких оснований предполагать, что эти шаблоны не пересекаются и что общее разделение является подходящим.

Вместо этого анализ корзины рынка aka частая добыча предметов .

...