Значения тегов и мощность ряда
Influxdb создает новые серии для каждой комбинации пары (тег, значение), которую он видит.Пример в документации показывает это с тегом email
.Серийное количество элементов является ограничивающим фактором производительности.Независимые теги оказывают мультипликативное влияние на количество элементов в серии.
Мои данные
Я обрабатываю данные, которые естественно разбиваются на то, что я называю группами.Думайте об этом как о рекламной сети, которая обрабатывает рекламу клиентов, где клиент - это «группа».Я хотел бы отследить, сколько времени и ресурсов занимают разные группы для обработки.В настоящее время у меня около 1000 групп, и я работаю над планированием роста, поэтому давайте предположим, что скоро у меня будет 10 или 100 тысяч.Существуют и другие теги со значениями 10 или 100 (например, имя хоста).Все эти вещи важны для понимания наших данных.
У меня сейчас полмиллиона серий.Я не думаю, что у меня много данных.Я использую InfluxDB 1.2.4, похоже, что наша версия притока не обновляется слишком часто.
Мой вопрос
Это кажется относительно обычной потребностью, но, похоже, тожетот, который доставит мне неприятности с притоком.
- Неужели я запутался, что иду к боли?
- Есть ли лучший способ удовлетворить эту потребность?
- Я прямо использую не тот инструмент?