Мне нужно итеративно добавлять строки в DataFrame для панд, и это довольно сложно достичь. Кроме того, с точки зрения производительности, я не уверен, что это лучший подход.
Так что время от времени я получаю данные с сервера, и этот новый набор данных с сервера будет новой строкой в моей панде DataFrame,
import pandas as pd
import datetime
df = pd.DataFrame([], columns=['Timestamp', 'Value'])
# as this df will grow over time, is this a costly copy (df = df.append) or does pandas does some optimization there, or is there a better way to achieve this?
# ignore_index, as I want the index to automatically increment
df = df.append({'Timestamp': datetime.datetime.now()}, ignore_index=True)
print(df)
Через один день DataFrame будет удален, но в течение этого времени, вероятно, будет добавлено 100 тыс. Раз новой строки с данными.
Цель по-прежнему заключается в том, чтобы добиться этого вочень эффективный способ с точки зрения времени выполнения (память не имеет большого значения, так как имеется достаточно ОЗУ).