Новый python и табула. Я пытался преобразовать файл PDF в CSV, но столкнулся с проблемой при использовании read_pdf. Я получаю ошибку java. Буду очень признателен за любые советы или предложения.
import PyPDF2
import tabula
from tabula import read_pdf
* вставка и изменение кода моего pdf
df = read_pdf("test.pdf", pages=1)
Я получаю следующую ошибку:
Получил stderr : 2 апреля 2020 г. 22:19:52 орг. apache .pdfbox.rendering.PDFRenderer предлагает KCMS
ИНФОРМАЦИЯ: Ваша текущая версия java: 1.8.0_25
2 апреля , 2020 22:19:52 org. apache .pdfbox.rendering.PDFRenderer предлагает KCMS
ИНФОРМАЦИЯ: Чтобы повысить скорость рендеринга на старых java 1.8 или 9 версиях,
Apr 2, 2020 22:19:52 org. apache .pdfbox.rendering.PDFRenderer предложить KCMS
INFO: обновить до последней версии 1.8 или 9 (> = 1.8.0_191 или> = 9.0.4) ,
2 апреля 2020 г. 22:19:52 орг. apache .pdfbox.rendering.PDFRenderer предлагает KCMS
INFO: или
2 апреля 2020 г. 10: 19:52 вечера org. apache .pdfbox.rendering.PDFRenderer предлагает KCMS
INFO: используйте параметр -Dsun.java2d.cmm = sun.java2d.cmm.kcms.KcmsServiceProvider
апр. 2, 2020 22:19:52 org. apache .pdfbox. render.PDFRenderer предлагает KCMS
INFO: или вызвать System.setProperty ("sun.java2d.cmm", "sun.java2d.cmm.kcms.KcmsServiceProvider")