tabula-py: ненулевой статус выхода 1 при указании страниц - PullRequest
0 голосов
/ 20 апреля 2020

Использование tabula-py в Anaconda / Spyder для выполнения read_pdf для группы файлов PDF.

Я могу заставить код работать, пока pages = 'all', но как только я выберу указан c набор страниц Я получаю сообщение об ошибке. Смотрите ниже мои команды и ошибки.

Я знаю, что это произошло совсем немного, и решение состоит в том, чтобы обновить версию Java, но tabula-py работает нормально, пока pages = 'all' или одна страница. Я не уверен, как изменение параметра страницы для указания c нескольких страниц вызывает эту ошибку. Любая помощь будет оценена!

Команда:

df_report = read_pdf(report_file,
    pages='all',
    multiple_tables=True
    )

Ошибка:

CalledProcessError: Command '['java', '-Dfile.encoding=UTF8', '-jar', 'C:\\Users\\....\\AppData\\Local\\Continuum\\anaconda3\\lib\\site-packages\\tabula\\tabula-1.0.3-jar-with-dependencies.jar', '--pages', '1-5', '--lattice', '--guess', '--format', 'JSON', '..../s14.pdf']' returned non-zero exit status 1.

tabula.environment_info ()

Python version:
    3.7.4 (default, Aug  9 2019, 18:34:13) [MSC v.1915 64 bit (AMD64)]
Java version:
    openjdk version "11.0.6" 2020-01-14
OpenJDK Runtime Environment (build 11.0.6+8-b765.1)
OpenJDK 64-Bit Server VM (build 11.0.6+8-b765.1, mixed mode)
tabula-py version: 1.4.1
platform: Windows-10-10.0
...