Я построил граф свойств (60 миллионов узлов, 40 миллионов ребер) из s3, используя Apache структуру Spark Graphx. Я хочу запустить запросы обхода на этом графике.
Мои запросы будут такими: -
g.V().has("name","xyz").out('parent').out().has('name','abc')
g.V().has('proc_name','serv.exe').out('file_create').
has('file_path',containing('Tsk04.txt')).in().in('parent').values('proc_name')
g.V().has('md5','935ca12348040410e0b2a8215180474e').values('files')
в основном запросы имеют форму g.V().out().out().out()
Такие запросы легко возможны на графических базах данных, таких как neo4j, titan, aws neptune, поскольку они поддерживают гремлин.
Можно ли перемещаться по искровым графам таким образом. Я пробовал spark pregel-api, но это немного сложно по сравнению с gremlin.
Причина, по которой я ищу искровую диаграмму, заключается в том, что облачные решения вышеупомянутых graphdbs являются дорогостоящими.