вопрос один из дизайна. Я собираю большой кусок данных о производительности с большим количеством пар ключ-значение. почти все в / proc / cpuinfo, / proc / meminfo /, / proc / loadavg, а также куча других вещей с нескольких сотен хостов. сейчас мне просто нужно отобразить последние данные в моем интерфейсе. Я, вероятно, в конечном итоге проведу некоторый анализ собранных данных, чтобы выяснить проблемы с производительностью в будущем, но это новое приложение, поэтому я пока не уверен, что именно я ищу в плане производительности.
я мог бы структурировать данные в БД - иметь столбец для каждого ключа, который я собираю. таблица будет иметь ширину O (100) столбцов, было бы сложно поместить ее в БД, мне пришлось бы добавлять новые столбцы, если бы я начал собирать новую статистику. но было бы легко сортировать / анализировать данные, просто используя SQL.
или я мог бы просто выбросить мой неструктурированный большой двоичный объект в таблицу. возможно три столбца - идентификатор хоста, временная метка и сериализованная версия моего массива, возможно, с использованием JSON в поле TEXT.
что мне делать? я буду сожалеть, если я пойду с неструктурированным подходом? при анализе я должен просто преобразовать интересующие меня поля и создать новую, более структурированную таблицу? какие компромиссы мне здесь не хватает?