Класс, который вы ищете: RegexBasedLocationExtractionStrategy
.
Вы создаете его с помощью объекта String
, представляющего регулярное выражение, или напрямую передаете его регулярному выражению.
Затем вы применяете его к PdfPage
, используя PdfCanvasProcessor
, а затем вызываете getResultantLocations
.
PdfDocument pdfDoc = new PdfDocument(new PdfReader(SRC));
RegexBasedLocationExtractionStrategy extractionStrategy = new RegexBasedLocationExtractionStrategy(@"foobar");
IList<IPdfTextLocation> locationList = new List<IPdfTextLocation>();
PdfCanvasProcessor parser = new PdfCanvasProcessor(extractionStrategy);
parser.ProcessPageContent(pdfDoc.GetFirstPage());
extractionStrategy.GetResultantLocations(); // do something with them