ElasticSearch количественная корреляция с 2 полями Java API - PullRequest
0 голосов
/ 11 марта 2019

Мне нравятся данные лайков:

{a:a1, b:b1, c:c1}
{a:a1, b:b1, c:c2}
{a:a1, b:b2, c:c2}
{a:a2, b:b5, c:c8}
{a:a3, b:b4, c:c6}

Как получить все лайки результатов (с данными ~ 100M):

{a1: [b1, b1, b2], a2:[b5], a3 [b4]}

Примечание:

  • Я имею в виду, как groupby в пандах,
  • Я забочусь только о 2 полях ('a' и'b')
  • Оба типа значений полей 'a' и 'b': 'String'
  • Я использовал приведенный ниже код, но он не вернул весь результат.

    TermsAggregationBuilder yearAgg = AggregationBuilders.terms ("f1"). Field ("a.keyword") .subAggregation (AggregationBuilders.terms ("f2"). Field ("b.keyword"))

Большое спасибо !!

...