Вычисление сходства между двумя документами с использованием косинусного сходства (neo4j) - PullRequest
1 голос
/ 26 июня 2019

У меня есть два документа, представленные графиками в neo4j.Базовая версия графа, описывающего каждый документ:частота токена в документе).Я написал следующий запрос, но я не уверен, что он позволяет вычислить эффективность подобия:

MATCH (p1:DocumentNode {name: 'doc1'})-[r1:HAS_token]->(tag)
MATCH (p2:DocumentNode {name: "doc2"})-[r2:HAS_token]->(tag)
RETURN p1.name AS from,
       p2.name AS to,
       algo.similarity.cosine(collect(r1.score), collect(r2.score)) AS similarity

Кроме того, тег связан с категорией Wikipedia (представленной меткой Category) через отношение HAS_category,Есть ли способ включить категорию каждого тега при вычислении косинусного сходства?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...