Question

Я пытаюсь использовать Tabula-py для извлечения данных из PDF, однако я не могу заставить его работать.Я запускаю это в своей записной книжке Jupyter (на Mac):

from tabula import read_pdf
df = read_pdf("/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf")

И я получаю эту ошибку:

Error: 
---------------------------------------------------------------------------
CalledProcessError                        Traceback (most recent call last)
<ipython-input-5-57f646d3a440> in <module>()
----> 1 df = read_pdf("/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf")
      2 #/Users/jamesozden/Desktop/data_scrape_table.pdf

/Users/jamesozden/anaconda/lib/python2.7/site-packages/tabula/wrapper.pyc in read_pdf(input_path, output_format, encoding, java_options, pandas_options, multiple_tables, **kwargs)
     83 
     84     try:
---> 85         output = subprocess.check_output(args)
     86 
     87     except FileNotFoundError as e:

/Users/jamesozden/anaconda/lib/python2.7/subprocess.pyc in check_output(*popenargs, **kwargs)
    217         if cmd is None:
    218             cmd = popenargs[0]
--> 219         raise CalledProcessError(retcode, cmd, output=output)
    220     return output
    221 

CalledProcessError: Command '['java', '-jar', '/Users/jamesozden/anaconda/lib/python2.7/site-packages/tabula/tabula-1.0.1-jar-with-dependencies.jar', '--pages', '1', '--guess', '/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf']' returned non-zero exit status 1

Поэтому я прочитал несколько предыдущих вопросов о наличии Javaустановлено, что я и делаю.Я также удостоверился, что добавил путь к своему профилю bash (я относительно новичок в этом, поэтому я не уверен, правильно ли я это сделал).Вот строка, которую я добавил в свой bash.profile на тот случай, если кто-то захочет убедиться, что все в порядке, что я получил от использования which java:

export PATH="$HOME/usr/bin/java/bin:$PATH"

Любая помощь будет высоко оценена, спасибо!

Ozdanny · Answer 1 · 21 мая 2018

Мне удалось самому разобраться!Оказывается, даже несмотря на то, что я скачал обновленную версию Java, использовалась версия 1.6 (эта была замечена с использованием java -version).Я использовал homebrew для обновления до Java 8, и теперь он работает нормально.

Tabula-Py не работает - вызвана ошибка процесса - ненулевое состояние выхода 1

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Tabula-Py не работает - вызвана ошибка процесса - ненулевое состояние выхода 1

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы