Я пытаюсь использовать Python для запуска pdftotext, но по какой-то причине мой код не работает. Если я выполню приведенное ниже, я ожидаю, что переменная содержимого будет содержать содержимое PDF, но в результате я получаю просто пустую строку.
Кто-нибудь знает, что мне не хватает?
def getPDFContent(path):
path = "/path/to/a valid/pdffile.pdf"
process = subprocess.Popen(["pdftotext", path], shell=False,
stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
content, err = process.communicate()[0:2]
return content, err