Я использую приведенный ниже метод, когда мне нужно выяснить, присутствует ли текст в загруженном мной файле PDF.
public void iShouldVerify() throws Throwable {
export_inspections.verifyPDFContent("zzz");
public boolean verifyPDFContent(String reqTextInPDF) {
boolean flag = false;
PDFTextStripper pdfStripper = null;
PDDocument pdDoc = null;
COSDocument cosDoc = null;
String parsedText = null;
try {
File file = new File("/Users/mohand/Downloads/1956_ANewChecklistTemplate1Updated_BigTurnip_270618.pdf");
PDFParser parser = new PDFParser(new FileInputStream(file));
parser.parse();
cosDoc = parser.getDocument();
pdfStripper = new PDFTextStripper();
pdfStripper.setStartPage(1);
pdfStripper.setEndPage(1);
pdDoc = new PDDocument(cosDoc);
parsedText = pdfStripper.getText(pdDoc);
} catch (MalformedURLException e2) {
System.err.println("URL string could not be parsed " + e2.getMessage());
} catch (IOException e) {
System.err.println("Unable to open PDF Parser. " + e.getMessage());
try {
if (cosDoc != null)
cosDoc.close();
if (pdDoc != null)
pdDoc.close();
} catch (Exception e1) {
e.printStackTrace();
}
}
System.out.println("+++++++++++++++++");
System.out.println(parsedText);
System.out.println("+++++++++++++++++");
System.out.println(reqTextInPDF);
if (parsedText.contains(reqTextInPDF)) {
flag = true;
}
return flag;
}
Проблема в том, что код пропускается, даже если в PDF нет текста, называемого "zzz", код выполняется.
Как мне это утверждать? Или есть лучший способ справиться с этим?