У меня есть запрос на шифрование, который возвращает серию путей, которые частично перекрываются и приводят к образованию нескольких отдельных кластеров.В этом случае будет небольшое количество кластеров (100–1000) относительно небольшого размера (1–50 узлов).Полный набор данных обычно состоит из нескольких миллионов узлов (запрос извлекает относительно небольшое подмножество всех узлов).
Упрощенная версия запроса выглядит следующим образом:
MATCH p=(a:M)-[:F2EDGE]-(b:M) WHERE a.prop > 90 AND b.prop > 90 RETURN p
Фактический запрос будет немного сложнее, чем запрос с переменным числом промежуточных узлов, но это должно служить примером проблемы..
Теперь я хочу изучить различные кластеры, сгенерированные этим запросом.Я нашел документы по алгоритму Connected Components , который отображается в правильных строках, но я не понимаю, как это можно применить к списку путей, который является результатом запроса.Я хотел бы иметь возможность:
- получить список кластеров и некоторые основные свойства для этого (например, количество узлов)
- получить данные, которые позволили мне воспроизводимо получить этот кластерснова в будущем (возможно, извлекая идентификаторы узлов или добавляя новые «кластерные» узлы, которые связаны с каждым кластером)
Может кто-нибудь подсказать, как этого добиться?