Мне нужно получить схему (или закладки) из PDF-файла через PHP с библиотекой или без нее. В...
Я устанавливаю скрипт на основе PDFparser .Это работает для большинства типов PDF для меня.Мне...
У меня есть PDF-документ с рабочими чертежами.Я пытаюсь извлечь таблицы из чертежа, но, к сожалению...
Я получаю эту ошибку при разборе PDF-файла с помощью pypdf2. Я прилагаю PDF вместе с ошибкой. Я...
Я обнаружил проблему при синтаксическом анализе документов PDF, отправленных веб-службе для NLP. Мы...
Я новичок в PDFminer, использую "https://github.com/euske/pdfminer".. Я пытался проанализировать...
Когда я использую ghostscript с устройством textwrite, я получаю файл XML, который описывает мой...
Я получаю UserWarning: No tables found on page-1, когда пытаюсь извлечь таблицы из вложенного PDF....
Я пытаюсь удалить таблицы внутри страницы в формате pdf и пытаюсь использовать для этого функцию...
У меня есть некоторый текст, извлеченный из PDF-файлов, и я проанализировал текст, и в настоящее...
Я очень новичок в Apache Tika и пытаюсь понять, как его использовать. Я читал некоторые блоги через...
Я пытаюсь проанализировать pdf-файл, используя Apache Tika, используя ByteArrayInputStream для...
Я занимаюсь разработкой парсера / писателя PDF, но я застрял в создании перекрестных ссылок. Моя...
У меня есть тонна PDF-файлов, которые я хочу иметь возможность разбирать предложение за...