Как получить номер страницы тега в тегированном PDF - PullRequest
0 голосов
/ 24 февраля 2020

Я хочу получить номер страницы тега в PDF с тегами.

Я пробовал код ниже, но я не уверен.

for(Object coDic: structElement.getKids()) {
   int page=((PDStructureElement) coDic).getCOSObject().getCOSDictionary(COSName.PG).getInt(COSName.STRUCT_PARENTS);
}

1 Ответ

0 голосов
/ 24 февраля 2020

structParents - это нечто совершенно иное (см. спецификация PDF ). Сделайте это:

PDPage page = new PDPage(((PDStructureElement) coDic).getCOSObject().getCOSDictionary(COSName.PG));
int pageNum = doc.getPages().indexOf(page);

или лучше:

PDPage page = ((PDStructureElement) coDic).getPage();
int pageNum = doc.getPages().indexOf(page);

(нулевые проверки и проверки классов опущены)

...