Конструктор Itext PdfTextExtractor не определен - PullRequest
0 голосов
/ 23 октября 2019

Я использую Eclipse и iText для чтения документа в формате PDF для извлечения всего текста и записи этого текста в файл.

Я использую этот фрагмент кода для извлечения текста из PDF.

PdfReader reader = new PdfReader("pdftotext.pdf");
PdfTextExtractor extractor = new PdfTextExtractor(reader);        
int pagenumber = reader.getNumberOfPages();
for(int i = 1; i<= pagenumber; i++) {
    System.out.println("============PAGE NUMBER " + i + "=============" );
    String line = extractor.getTextFromPage(i);
    System.out.println(line);
}

Но я получаю сообщение об ошибке -> PdfTextExtractor extractor = new PdfTextExtractor(reader);

Я должен иметь возможность использовать PdfTextExtractor, но он выдает ошибку консоли:

The constructor PdfTextExtractor(PdfReader) is undefined

1 Ответ

0 голосов
/ 23 октября 2019

Класс PdfTextExtractor не имеет открытого конструктора. Однако вы могли бы написать свой код следующим образом:

PdfReader reader = new PdfReader(SRC);
for (int i = 1; i <= reader.getNumberOfPages(); i++) {
      System.out.println("============PAGE NUMBER " + i + "=============" );
      System.out.println(PdfTextExtractor.getTextFromPage(reader, i));
}

Для завершения, поскольку iText 5 устарел (код выше), здесь точно такой же код, но для iText 7 (тот же класс- PdfTextExtractor ):

PdfDocument document = new PdfDocument(new PdfReader(SRC));

for (int i = 1; i <= document.getNumberOfPages(); i++) {
    System.out.println("============PAGE NUMBER " + i + "=============" );
    System.out.println(PdfTextExtractor.getTextFromPage(document.getPage(i)));
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...