Камелот может правильно определить схему таблицы на странице PDF, однако некоторые столбцы содержат...
Я пытаюсь запустить следующий код в Python 3.7.Я продолжаю получать неверную синтаксическую ошибку...
Я пытаюсь извлечь некоторый текст из определенной области в PDF.Всего в PDF 10 разделов, и я хочу...
Я сгенерировал PDF, используя данные XSLT и XML.Теперь я хочу проверить, все ли содержимое...
Я использую python 3.6 на Mac OS X.Я использую решение, опубликованное здесь для использования...
Я испытываю странное поведение с pdfminer.six.Я пытаюсь разобрать абзацы из договорных документов
Я пытался установить pdfminer в Anaconda около получаса, и я вижу сообщение только в Терминале...
Есть ли способ использовать pdfminer для извлечения размера шрифта.Я не хочу использовать...
У меня есть 5 pdf-файлов, которые я хочу преобразовать в txt-файлы. 3 из файлов работают нормально....
Я использую pdfminer с python 3 и получаю странные буквы в тексте, который восстанавливается из pdf
Я скачал pdfminer.six и ожидал получить инструмент командной строки pdf2txt.py как часть пакета.Но...
Мне нужно очистить некоторые PDF-файлы, чтобы извлечь следующую текстовую информацию: Я попытался...
Я использую PDFMiner6 с Python 3.5.Это намного лучше, чем PyPDF2 (медленнее, но точнее и не выдает...
Я использую библиотеку python PyPDF2, чтобы обрезать многие PDF-файлы, чтобы вырезать ненужную...
Я пытаюсь извлечь текст из отсканированного PDF с помощью PyPDF2.Некоторые из pdf содержат текст,...
Я извлекаю текст на французском языке из PDF, используя pdfminer и python.Проблема в том, что я не...
Документация для pdfminer в лучшем случае плохая.Сначала я использовал pdfminer, и он работал для...
Я использую textract для получения простого текста из файлов PDF.Для простого текста каждого файла...
Я знаю, как использовать pdfminer.six pdf2txt.py в командной строке;Тем не менее, у меня есть много...
Я извлекаю пары имен и значений из некоторых PDF-форм, используя этот код: from pdfminer.pdfparser...
Я пытаюсь извлечь текст с первой страницы защищенного PDF-файла. У меня нет пароля, но функция...
У меня есть несколько PDF-файлов, которые организованы в столбцы, которые мне нужно почистить....
Библиотека Python выводит мне двоичные строки utf-8 с текстовым дампом, например: In [1]: string...
PDFMiner.six застревает на некоторых файлах с разрешением изображения и текстом, поэтому я подумал,...
У меня есть несколько PDF-файлов на хинди, которые содержат извлекаемый текст.Я использовал...