Вам нужна библиотека, такая как jPod , которая может анализировать документы PDF обратно в структуру, из которой они были сгенерированы.Спецификация PDF серьезно сложна, но если вы просто хотите поцарапать текст и, возможно, размер шрифта или два, это не должно быть слишком сложно.