Возникла проблема при разборе PDF с Jpedal .
Читая wordlist
из Jpedal, я получаю искаженные символы в wordslist
.Это также происходит при использовании OCR , а также когда я копирую текст из PDF и вставляю его в Word или простой текстовый редактор.Я понимаю, что этот PDF был сгенерирован с помощью Кварцевый контекст PDF на MAC OS X 10.6.4 , который используется для сжатияразмер файла, но легко просматривается в средствах просмотра PDF.Я искал любой API Java, поддерживающий декодирование этого вида PDF, но безуспешно.Я ищу любое приложение или Java API, которые я могу использовать для его декодирования;должен использоваться на машине с Linux.