Question

Я не могу найти пример того, как использовать API iText для получения позиций (x, y) конкретной комбинации символов (например, + <) в документе PDF.Я могу найти положение строк или кусков с такими символами.Но насколько я знаю, даже если бы эти символы были отдельным словом в документе, это не гарантирует, что это будет отдельный фрагмент. </p>

Joris Schellekens · Answer 1 · 23 ноября 2018

Класс, который вы ищете: RegexBasedLocationExtractionStrategy.

Вы создаете его с помощью объекта String, представляющего регулярное выражение, или напрямую передаете его регулярному выражению.

Затем вы применяете его к PdfPage, используя PdfCanvasProcessor, а затем вызываете getResultantLocations.

PdfDocument pdfDoc = new PdfDocument(new PdfReader(SRC));

RegexBasedLocationExtractionStrategy extractionStrategy = new RegexBasedLocationExtractionStrategy(@"foobar");

IList<IPdfTextLocation> locationList = new List<IPdfTextLocation>();

PdfCanvasProcessor parser = new PdfCanvasProcessor(extractionStrategy);
parser.ProcessPageContent(pdfDoc.GetFirstPage());

extractionStrategy.GetResultantLocations(); // do something with them

iText - получить позицию комбинации символов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

iText - получить позицию комбинации символов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов