Каков наилучший метод / формат для сохранения объекта таблиц из Camelot [список фреймов данных] в файл, к которому я смогу получить доступ позже? В настоящее время используется формат pickle, но размер файла довольно большой. 5 МБ PDF приводит к 1 ГБ маринованному файлу. Пример ниже:
> for x in files_in_folder_path[1:2]:
> DataID = x.replace('F:/Version 4 - Final/PDF/', '').replace('.pdf', '')
> tables = camelot.read_pdf(x, pages = 'all', flag_size=True, copy_text=['v'], line_scale=40)
> open_string = 'F:/Version 4 - Final/Camelot - Pickles/Camelot_' + DataID + '.pkl'
> with open(open_string, 'wb') as f:
> pickle.dump(tables, f)
Заранее спасибо!