У меня есть таблица Influxdb (v 1.7.1) со схемой, подобной этой:
table_name
tags: tag_1, tag_2, tag_3
fields: field_1, field_2, field_3
все поля сильно различаются (миллионы разных значений), поэтому их нельзя использовать в качестве тегов, есть ошибки во многих сериях
Результат, который мне нужен, это количество различных комбинаций между field_1
и field_2
, сгруппированных по дням, и некоторых тегов
В PostgreSQL мы достигаем этого с помощью группировки field_1
, а затем подсчитывая различные значения field_2
, количество строк велико, а запросы замедляются.
Я застрял с различными комбинациями между двумя полями, группировать части легко.
Distinct работает только с одним полем InflowDB.
Идея заключалась в том, чтобы объединить их в другую серию, а затем сосчитать, у притока такого нет.
На одно field_1
значение у меня есть сотни тысяч не уникальных field_2
значений. У меня есть миллионы значений field_1
и field_2
, поэтому о перемещении их в теги и группировке не может быть и речи.
Мне нужна стратегия возможного агрегирования данных, пока я не доберусь до этого количества.