Сохранение объекта таблиц Camelot в файл (например, pickle) - PullRequest
0 голосов
/ 18 января 2020

Каков наилучший метод / формат для сохранения объекта таблиц из Camelot [список фреймов данных] в файл, к которому я смогу получить доступ позже? В настоящее время используется формат pickle, но размер файла довольно большой. 5 МБ PDF приводит к 1 ГБ маринованному файлу. Пример ниже:

> for x in files_in_folder_path[1:2]:
>     DataID = x.replace('F:/Version 4 - Final/PDF/', '').replace('.pdf', '')
>     tables = camelot.read_pdf(x, pages = 'all', flag_size=True, copy_text=['v'], line_scale=40)
>     open_string = 'F:/Version 4 - Final/Camelot - Pickles/Camelot_' + DataID + '.pkl'
>     with open(open_string, 'wb') as f:
>         pickle.dump(tables, f)

Заранее спасибо!

...