Извлечение страницы из PDF-документа (с использованием PDFBox) - PullRequest
0 голосов
/ 28 декабря 2018

Я пытаюсь разбить PDF на отдельные страницы.Хотя это функционально работает, pdf для каждой страницы в конечном итоге будет почти размером с исходный PDF (250 МБ).Я видел некоторые ссылки при удалении аннотаций, которые могут включать ссылки на другие страницы / ресурсы.Я попробовал ниже, но не повезло.Может кто-нибудь сообщить мне, что я делаю не так?

(код ниже на Kotlin).Я также пытался использовать addPage против importPage, так как последний создает глубокую копию.Тот же результат.

doc.pages.forEachIndexed { idx: Int, p: PDPage ->
  val newDoc = PDDocument()
  val newPage = newDoc.importPage(p)
  newPage.annotations = null
  newPage.resources = null
  newDoc.save("/tmp/$idx.pdf")
  newDoc.close()
}
...