Невозможно проанализировать pdf от Jpedal - PullRequest
2 голосов
/ 02 июля 2010

Возникла проблема при разборе PDF с Jpedal .

Читая wordlist из Jpedal, я получаю искаженные символы в wordslist.Это также происходит при использовании OCR , а также когда я копирую текст из PDF и вставляю его в Word или простой текстовый редактор.Я понимаю, что этот PDF был сгенерирован с помощью Кварцевый контекст PDF на MAC OS X 10.6.4 , который используется для сжатияразмер файла, но легко просматривается в средствах просмотра PDF.Я искал любой API Java, поддерживающий декодирование этого вида PDF, но безуспешно.Я ищу любое приложение или Java API, которые я могу использовать для его декодирования;должен использоваться на машине с Linux.

1 Ответ

1 голос
/ 16 июля 2010

Хе всех

Выкладываю возможное решение проблемы. Вот ссылка , описывающая, как кварц анализирует pdf и, конечно, который должен быть реализован в коде, до сих пор я не нашел готового API для него, и я полагаю, что stackoverflow - это инициатива и ответьте на вопросы, которые не были сделаны или заданы ранее.

привет

Rituraj

...