Я использую PdfBox для извлечения информации из файла PDF, но по какой-то причине я не могу загрузить сам файл PDF. Я попытался открыть его в Adobe Acrobat Reader D C. Я не могу прочитать файл в PdfBox, потому что есть проблема с форматом файла PDF. При открытии в NotePad ++ он выдает следующее содержимое:
<!doctype html>
<meta http-equiv="X-UA-Compatible" content="IE=edge, chrome=1" />
<meta charset="utf-8" />
Что означает html?
Я использую PDDocument pdDocument = PDDocument.load(pdfFile)
для загрузки файла PDF (pdfFile
равно ByteArrayInputStream
)