У меня есть 1 миллион строк:на совокупности шаблонов просмотра клиентов.Как мне это сделать?
Еще один шаг, который я предпринял, - это загрузить эти данные в Elasticsearch и выполнить запрос значительное_терм по отношению к представлениям клиентов, используя каждый из моих идентификаторов продукта.Затем я возвращаю 10 продуктов для каждого продукта, которые, скорее всего, будут просмотрены вместе, вместе с оценкой.Мое конечное желание состоит в том, чтобы иметь возможность кластеризовать данные этого продукта таким образом, чтобы разграничить различные «индивидуальные» типы или интересы.
Может ли графическая база данных, подобная neo4j, помочь здесь или какой-то другой алгоритм кластеризации?