Я хочу получить номер страницы тега в PDF с тегами.
Я пробовал код ниже, но я не уверен.
for(Object coDic: structElement.getKids()) { int page=((PDStructureElement) coDic).getCOSObject().getCOSDictionary(COSName.PG).getInt(COSName.STRUCT_PARENTS); }
structParents - это нечто совершенно иное (см. спецификация PDF ). Сделайте это:
PDPage page = new PDPage(((PDStructureElement) coDic).getCOSObject().getCOSDictionary(COSName.PG)); int pageNum = doc.getPages().indexOf(page);
или лучше:
PDPage page = ((PDStructureElement) coDic).getPage(); int pageNum = doc.getPages().indexOf(page);
(нулевые проверки и проверки классов опущены)