Недавно мне удалось собрать табличные данные из файла PDF, используя камелот в python. Под сбором я подразумеваю распечатать его на терминале. Теперь я хотел бы найти способ автоматизировать результаты в виде гистограммы на matplotlib. как бы мне это сделать? Вот мой код для извлечения табличных данных из pdf:
import camelot
tables = camelot.read_pdf("data_table.pdf", pages='2')
print(tables[0].df)
Вот изображение таблицы введите описание изображения здесь
который затем распечатывает большую таблицу в моем терминале:
0 1 2 3 4
0 Country \nCase definition \nCumulative cases \...
1 Guinea Confirmed 2727 156 1683
2 Probable 374 * 374
3 Suspected 7 * ‡
4 Total 3108 156 2057
5 Liberia** Confirmed 3149 11 ‡
6 Probable 1876 * ‡
7 Suspected 3982 * ‡
8 Total 9007 11 3900
9 Sierra Leone Confirmed 8212 230 3042
10 Probable 287 * 208
11 Suspected 2604 * 158
12 Total 11103 230 3408
13 Total 23 218 397 9365
У меня есть небольшой опыт работы с matplotlib, и я знаю, как рисовать данные вручную, но не автоматически из pdf. Это сэкономит мне время, так как я пытаюсь автоматизировать весь процесс.