У меня очень большой набор данных, близкий к 500 миллионам ребер, в котором необходимо пройти почти все ребра. Я пытаюсь распараллелить эти обходы, пытаясь разбить страницы на IDS. Моя стратегия состояла в том, чтобы попытаться разбить на страницы по идентификатору, который является хешем MD5. Я пробовал запросы, подобные следующим:
g.E().hasLabel('foo').has(id, TextP.startingWith('AAA'))
для страницы 1 g.E().hasLabel('foo').has(id, TextP.startingWith('AAB'))
для страницы 2
Но каждый запрос, кажется, выполняет полное сканирование, а не только подмножество. Как вы рекомендуете делать пагинацию?