Influxdb считает различные объединения двух полей (считает различные комбинации двух полей) - PullRequest
0 голосов
/ 07 января 2019

У меня есть таблица Influxdb (v 1.7.1) со схемой, подобной этой:

table_name
tags:  tag_1, tag_2, tag_3
fields:  field_1, field_2, field_3

все поля сильно различаются (миллионы разных значений), поэтому их нельзя использовать в качестве тегов, есть ошибки во многих сериях

Результат, который мне нужен, это количество различных комбинаций между field_1 и field_2, сгруппированных по дням, и некоторых тегов

В PostgreSQL мы достигаем этого с помощью группировки field_1, а затем подсчитывая различные значения field_2, количество строк велико, а запросы замедляются.

Я застрял с различными комбинациями между двумя полями, группировать части легко. Distinct работает только с одним полем InflowDB. Идея заключалась в том, чтобы объединить их в другую серию, а затем сосчитать, у притока такого нет.

На одно field_1 значение у меня есть сотни тысяч не уникальных field_2 значений. У меня есть миллионы значений field_1 и field_2, поэтому о перемещении их в теги и группировке не может быть и речи.

Мне нужна стратегия возможного агрегирования данных, пока я не доберусь до этого количества.

...