unicodeDecodeError при использовании сланца - PullRequest
0 голосов
/ 23 января 2019

У меня есть несколько PDF-файлов, из которых мне нужно извлечь информацию.Я использую Python, на Centos 7 с библиотекой Python.В начале, шифер работает отлично.Но тогда я должен обновить несколько модулей и библиотек.Шиферная библиотека больше не работает.Чтобы решить эту проблему, я попытался обновить Slate и пытался использовать разные версии, но ни одна из них не работает.Ошибка:

File "/usr/lib64/python2.7/StringIO.py", line 271, in getvalue
self.buf += ''.join(self.buflist)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 58: ordinal not in range(128)`

Когда я снимаю планшет с моего кода, все работает просто отлично.

Кусок кода, который я использую сланца:

def adequacaoCut(pdf, person, pathInt, pathImg):
    with open('pdfs/'+pdf, 'rb') as f:
        doc = slate.PDF(f)
        print doc
        ... rest of code that works fine
  • Версия сланца: 0.5.2

  • Версия питона: 2.7

Со временем, я непомните больше, что libs или обновления на Python, Centos или все, что я сделал.Что я должен делать?

1 Ответ

0 голосов
/ 24 января 2019

Я решаю проблему сам. Я обнаружил, что у меня есть два pdfminer на моем компьютере (pdfminer и pdfminer.six). Я думаю, что был какой-то конфликт между библиотеками, или Slate пытался вызвать pdfminer.six вместо pdfminer. Я удаляю оба и переустанавливаю только pdfminer. Теперь это работает как шарм.

...