Python 3.6: данные извлекаются при извлечении из таблицы PDF - PullRequest
0 голосов
/ 07 апреля 2019

Я пытаюсь извлечь фрейм данных из таблицы PDF с помощью Tabula. Я собрал все данные, и у меня возникли проблемы с заказом. Кто-нибудь может указать, где мой синтаксис неверен?

Изображения таблицы и вывод моей сессии Python:

enter image description here
(Щелкните изображения, чтобы увеличить)

output of my Python session

Код:

import tabulate as tabulate  
import tabula
from tabula import read_pdf
import pandas as pd
import camelot
a = read_pdf(r"C:\Users\Emege\Downloads\cencosud.pdf", pages = 6, guess = False,\
        encoding = "ISO-8859-1" ,output_format = "csv")

print(a)
a.to_csv("cen.csv", encoding = "utf-8")

b = camelot.read_pdf(r"C:\Users\Emege\Downloads\cencosud.pdf")
print(b)
...