Я использую этот фрагмент кода для чтения файла PDF, но я не уверен, как извлечь из текста информацию о стиле шрифта (например, выделен ли он жирным шрифтом или нет). Эта библиотека довольно старая, поэтому, если есть новый способ сделать это, предложения приветствуются.
System.out.println("Reading pdf " + filename + ".pdf...");
PDDocument document = PDDocument.load(file);
PDFTextStripper pdfStripper = new PDFTextStripper();
String text = pdfStripper.getText(document);