Занимался чем-то подобным, поэтому я решил передать то, что нашел.
Вот код для создания моего оригинального PDF с использованием itext.
import com.lowagie.text.Document
import com.lowagie.text.Paragraph
import com.lowagie.text.pdf.PdfWriter
class SimplePdfCreator {
void createFrom(String path) {
Document d = new Document()
try {
PdfWriter writer = PdfWriter.getInstance(d, new FileOutputStream(path))
d.open()
d.add(new Paragraph("This is a test."))
d.close()
} catch (Exception e) {
e.printStackTrace()
}
}
}
Если открыть файл PDF, вы увидите текст в верхнем левом углу. Вот тест, показывающий, что вы ищете.
@Test
void createFrom_using_pdf_box_to_extract_text_targeted_extraction() {
new SimplePdfCreator().createFrom("myFileLocation")
def doc = PDDocument.load("myFileLocation")
Rectangle2D.Double d = new Rectangle2D.Double(0, 0, 120, 100)
def stripper = new PDFTextStripperByArea()
def pages = doc.getDocumentCatalog().allPages
stripper.addRegion("myRegion", d)
stripper.extractRegions(pages[0])
assert stripper.getTextForRegion("myRegion").contains("This is a test.")
}
Позиция (0, 0) - верхний левый угол документа. Ширина и высота движутся вниз и вправо. Я смог немного урезать диапазон до (35, 52, 120, 3) и все равно пройти тест.
Весь код написан на Groovy.