Я борюсь с простым сценарием, чтобы переименовать несколько тысяч pdf-файлов, которые содержат...
Я хочу, чтобы список всех жирных слов из файла PDF был записан в файл txt / docx с использованием...
Я пытаюсь извлечь некоторые подробности из отчета о крови: Ввод: PATIENT NAME : XYZ PATIENT ID :...
pdftotext похоже, что требуется только имя файла pdf или путь к нему.Документы не очень полезны...
Это работает локально, но не в контейнере Docker.Я пытаюсь запустить pdftotext в контейнере Docker,...
Я пытаюсь разработать приложение, которое требует, чтобы я читал в тексте из PDF-файлов, поэтому я...
Мне нужно автоматизировать преобразование многих PDF в текстовые файлы, используя AWS lambda в...
Я пытаюсь извлечь какой-то текст из PDF-файла в Laravel, используя Spatie-PdfToText.Тем не менее, я...
Я пытаюсь создать свою собственную функцию «извлечения таблицы» для файла PDF, в которой я могу...
В настоящее время я пытаюсь создать анализатор таблиц файлов PDF, в котором пользователи могут...
У меня есть документ PDF с содержанием ниже (упрощенно): pdftotext mypdf.pdf -layout генерирует:...
https://stackoverflow.com/a/26673448/8845351 видел это, и теперь я застрял в записи данных,...
Я получаю сообщение об ошибке «Команда« type -P pdftotext »не выполнена. Код выхода: 127 (Команда...
Показывает ошибка: команда 'cl.exe' завершилась неудачно: нет такого файла или каталога У меня есть...
Я пытаюсь запустить следующий код, чтобы найти следующие слова в тексте после слова «экзамен». Ввод...
Я работаю над анализатором счетов, который извлекает данные из счетов в формате pdf или изображения
Я наконец-то получил свой сценарий для отправки PDF-документа в Google Storage, а затем для...
У меня есть скрипт Python, который преобразует содержимое PDF в строку. text = list(); #npages is...
Я пытаюсь извлечь текстовую информацию из (цифрового) PDF путем определения содержания и...
Я ищу способ извлечь текст и положение этого текста из PDF с помощью «текстового слоя».Моя цель -...
Я использую php Pdfparser и pdftotext для извлечения текста хинди / девнагри из pdf.Но я получаю...
Я пытаюсь развернуть небольшой код Python 3.7, который использует «pdftotext» на AWS-Lambda.Мне...
Использую ли PDFMiner для извлечения данных из PDF, до этого я использовал pdftotext, который мог...
У меня есть PDF-документ длиной более 8000 страниц. Каждая страница связана с определенным знаком с...
Я работаю над Python pdfminer.six, который изначально отлично работал для меня, но теперь у меня...