Пакетное преобразование PDF в TXT Python - PullRequest
0 голосов
/ 04 июня 2018

Я пытаюсь преобразовать папку с именем «2017», которая заполнена 63 PDF-файлами стенограмм Верховного суда.Мне нужно, чтобы они были текстовыми файлами, чтобы я мог выполнять анализ текста на них.

Я видел вопросы о pdf в txt в R здесь, но не для python.До сих пор я пробовал:

converting pdf to txt like this

Однако он не сохраняет преобразованные файлы в новую папку на моем компьютере под названием 2017-txt, как я пытаюсь.Я создал эту папку на рабочем столе под названием 2017-txt.

Есть совет?Это просто печать списка имен PDF.

1 Ответ

0 голосов
/ 04 июня 2018

Функция печати не выводит файл.Похоже, что строки, которые вы закомментировали, должны выполнять запись в файл.Попробуйте удалить символ # в начале этих строк и посмотрите, что вы получите.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...