Я нахожусь в процессе настройки службы мониторинга через Python, которая будет запрашивать веб-API. Он будет выполнять множество простых действий, таких как подсчет количества возвращенных записей и отслеживание времени выполнения каждого запроса. Фактические возвращенные данные не имеют никакого значения, кроме количества записей, но вот бесполезный фрагмент:
Value Timestamp UnitsAbbreviation Good Questionable Substituted
0 0 2019-04-01T02:50:40Z True False False
1 0 2019-04-01T02:50:40Z True False False
2 0 2019-04-01T02:55:40Z True False False
3 0 2019-04-01T02:55:40Z True False False
4 0 2019-04-01T03:00:40Z True False False
5 0 2019-04-01T03:00:40Z True False False
Поскольку мои данные находятся в OSI PI, я изначально шел по пути использования библиотеки, которая загружает данные в Dataframe. В какой-то момент все данные возвращаются как JSON, но библиотека включает их в Dataframe для вас. Я подумал, что Dataframe обладает гораздо большей мощью / возможностями, чем то, что мне нужно сделать. Я ожидал бы, что это будет занимать больше памяти, чем другие методы.
Итак, у меня два вопроса:
Для моего случая использования есть более легкий и эффективный способ использовать API, рассчитать время события туда и обратно, а затем подсчитать количество записей?
В общем, насколько тяжелым является Dataframe и какие альтернативы легче / дешевле?