Нептун | Гремлин Python | Параллельные запросы с использованием веб-сокетов - PullRequest
1 голос
/ 29 апреля 2020

Каков наилучший способ выполнения параллельных запросов из записной книжки gremlin python jupyter в кластер Neptune? Я пытаюсь решить эту проблему с помощью пакета Multiprocess в Python. Тем не менее, мои три читателя db.r5.4xlarge максимально быстро работают на 100% CPU, как показано на графике ниже График 1 - загрузка ЦП, а график 2 - ошибки Гремлина. Ниже мой код. Есть ли способ, которым это можно лучше решить с помощью веб-сокетов? Если да, можете ли вы помочь мне с этим, так как я очень плохо знаком с Гремлином или Нептуном.

params = [tuple(x) for x in new_registrations_list[['id','createddate']].values]
pool = Pool(42)
df=pool.starmap(process_vertex,params)
pool.close()


def process_vertex(vertex_id, reg_date):    
    g=neptune.graphTraversal(neptune_endpoint='neptune-endpoint', neptune_port=xxx1x)
    vertices=g.V(str(vertex_id)).repeat(__.both().dedup()).emit().project('id').by(T.id).toList()

enter image description here

enter image description here

...