Вам может понадобиться много памяти, какой бы вариант вы не выбрали.
Однако, чего вам, безусловно, следует избегать, это использовать pd.DataFrame.append
внутри цикла.Это дороже по сравнению с list.append
.
Вместо этого агрегируйте в список списков, а затем добавляйте в фрейм данных.Поскольку вы не предоставили пример, вот некоторый псевдокод:
# initialize empty list
L = []
for line in my_binary_file:
# extract components required from each line to a list of Python types
line_vars = [line['var1'], line['var2'], line['var3']]
# append to list of results
L.append(line_vars)
# create dataframe from list of lists
df = pd.DataFrame(L, columns=['var1', 'var2', 'var3'])