Я использую Apache PDFBox для сканирования PDF-файлов в поисках ссылок на определенный файл.
У меня есть около тысячи PDF-файлов для сканирования и большинство ссылок (на самом деле все, кромеодна, насколько я вижу сейчас) найдены.
Однако в PDF есть одна конкретная ссылка, которую PDFBox просто игнорирует.Если я открываю PDF с помощью Foxit и проверяю свойства ссылки, она выглядит точно так же, как и все остальные ссылки (которые do найдены).
Вот код, который я использую для перебора ссылок:
for( Object p : pages ) {
PDPage page = (PDPage)p;
List<?> annotations = page.getAnnotations();
for( Object a : annotations ) {
PDAnnotation annotation = (PDAnnotation)a;
if( annotation instanceof PDAnnotationLink ) {
PDAnnotationLink link = (PDAnnotationLink)annotation;
/* Do stuff with the link */
}
}
}
В затронутом PDF-файле page.getAnnotations()
возвращает пустой список.
Есть ли какой-либо другой тип ссылки, кроме аннотаций, о которых мне следует знать?