Поскольку никто не смог ответить на этот вопрос, я отвечу на него наилучшим образом, насколько я знаю, его понимаю.
Кажется, что нет разницы в производительности между одной большой серией измерений и меньшей серией измерений.
Но есть критическое различие, которое в нашем случае привело к нескольким измерениям:
В нашем случае, когда схемы между различными измерениями имеют одни и те же поля, некоторые измерения могут иметь дополнительные fields.
Проблема в том, что поля кажутся связанными с самим измерением, поэтому, если мы добавим
data,device=0bd8,var=5053 value=10 1574173550390000
data,device=0bd8,var=5053 value=10 1574173550400000
data,device=0bd8,var=5054 foo=12,value=10 1574173550390000
data,device=0bd8,var=5055 bar=10,value=10 1574173550390000
тот факт, что var 5054
имеет поле foo
и 5055
имеет поле bar
, означающее, что при запросе любой переменной вы получите и foo
, и bar
(установите значение Нет, если они не существуют):
{'foo': None, 'bar': None}
Это означает что если у вас есть 100 переменных, и каждая добавка скажет, 5 настраиваемых полей, вы получите 500 полей при каждом запросе. И хотя это не проблема хранения, тот факт, что поля связаны с измерением, означает, что у вас будет экспоненциальный рост объекта JSON, возвращаемого базой данных, даже если для большинства полей установлено значение Нет.
Если схема должна быть одинаковой для всех измерений, то, по-видимому, нет разницы между использованием одного data
измерения (с разными тегами) по сравнению с. несколько data.<var>
измерений.