найти дубликаты в гремлине - PullRequest
0 голосов
/ 24 мая 2018

У меня были данные на AWS Neptune GraphDB.Каждая запись в нем имеет KeyId (свойство) с уникальными значениями.Некоторые данные были продублированы, что можно найти с помощью шагов KeyId (свойство) и groupCount ().Мой вопрос, могу ли я отфильтровать значения с помощью groupCount () более одного.Или любой другой лучший способ найти дубликаты по ключу.

gremlin> g.V().has('keyId').groupCount().by('keyId')
==> [HJ001:2, HJ002:1,HJ003:1,HJ004:2,HJ005:3]

Мне нужен только результат с groupCount> 1. (но не count = 1), кто-нибудь может мне помочь с этим.

1 Ответ

0 голосов
/ 24 мая 2018

Если вы добавите в свой запрос следующее, это даст вам то, что вы хотите.

g.V().has('keyId').groupCount().by('keyId').
      unfold().where(select(values).is(gt(1)))

Cheers Kelvin

...