Я использую Neo4j для хранения данных графика и знаю, что хочу использовать Spark в качестве механизма выполнения для моей аналитики по бесконечным причинам.
В поисках графовых алгоритмов, чтобы сделать мою жизнь проще - сначала я читал о документации Spark GraphX .Хотя я ожидал графическую версию MLlib, единственными выделенными алгоритмами были PageRank / Pregel.Между тем, все триплетные и соседние методы кажутся довольно простыми запросами Cypher.Затем я наткнулся на Cypher для Apache Spark (CAPS).
Похоже, что PropertyGraph
CAPS - это абстракция Spark DataFrame, а GraphX graph
- это абстракция Spark RDD,Имеет ли это большое значение?
Существуют ли основные отличия, которые отличают аналитические возможности GraphX и Cypher?