Можно ли конвертировать PDF в текст? - PullRequest
4 голосов
/ 26 августа 2011

В своем приложении я загружаю файл pdf из сети. Можно ли в Android конвертировать этот файл PDF в текст (строка или символ)?

Пожалуйста, дайте мне ваше ценное предложение.

Ответы [ 4 ]

4 голосов
/ 26 августа 2011

На самом деле, есть возможность конвертировать PDF в текст. Тем не менее, лучше использовать термин «преобразовать».

Вам нужен инструмент OCR, только если в PDF есть только изображения. Обычно это тот случай, если PDF является результатом сканирования документов. Но даже в этом случае драйвер сканера часто вставляет текст как невидимый текст, чтобы можно было искать содержимое PDF.

0 голосов
/ 26 августа 2011

Бруно Лоуги (Bruno Lowagie), разработчик iText, говорит, к сожалению, нет.

Это очень нормально. Это «в природе» PDF. PDF - односторонний процесс. PDF - это конечный продукт. Вы не должны конвертировать его в текст.

Вам нужен инструмент OCR.

http://itext -general.2136553.n4.nabble.com / Convert-PDF в текст-td2142916.html

С уважением, Стефан

0 голосов
/ 26 августа 2011

проверить http://pdfbox.apache.org/. Я не использовал его и не знаю, использует ли он awt для обработки pdf. Поскольку Android не поддерживает AWT PLZ, проверьте использование AWT.

0 голосов
/ 26 августа 2011

Существуют инструменты с открытым исходным кодом, которые пытаются это сделать, хотя по понятным причинам результат часто не идеален.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...