Я хочу использовать команду git bash pdftotext
из сценария python. Я пробовал библиотеки pypdf
, pdfminer
и tika
, но ни одна из них не поддерживает структуру файла PDF так, как мне нужно. Я попробовал строку ниже, я не получаю никакой ошибки, но нет и выходного файла.
os.system("start \"\" \"C:\Program Files\Git\git-bash.exe\" --login pdftotext -table '%s' '%s'" % (input, output))