Получить свойства шрифта PDF-текста с pdfbox - PullRequest
0 голосов
/ 20 марта 2012

Я работаю над PDFBox, чтобы извлечь содержимое файла PDF.Я могу извлечь текст, но мне также нужно получить свойства шрифта текста.Так может ли кто-нибудь помочь мне в извлечении свойств шрифта?

, и у меня также возникают проблемы с правильным извлечением некоторых символов.PDFBox дает '?'когда он не может распознать персонажа.поэтому также дайте мне несколько советов, чтобы решить проблему, если это возможно ..

Заранее спасибо ..

1 Ответ

0 голосов
/ 24 мая 2012
import org.apache.pdfbox.pdmodel.PDDocument;  
import org.apache.pdfbox.util.PDFTextStripper;  
public class pdf2box {  
    public static void main(String args[])
    {
        try
        {
    PDDocument pddDocument=PDDocument.load("table2.pdf");
    PDFTextStripper textStripper=new PDFTextStripper();
    System.out.println(textStripper.getText(pddDocument));
    textStripper.getFonts();



    pddDocument.close();
        }
        catch(Exception ex)
        {
        ex.printStackTrace();
        }
    }


}
...