При создании PDF-файла в Acrobat пользователь может создать «Веб-ссылки или ссылки на документы», которые вызывают это приглашение
![Create Link dialogue](https://raw.githubusercontent.com/chrisan/pdf-testing/master/edit-pdf.JPG)
было создано с 3 такими ссылками.Вам придется скачать, так как программа просмотра Github не отображает прямоугольники.
Существует ли инструмент / библиотека, которая может считывать и извлекать x, y WxH этих прямоугольников и содержащиеся в них ссылки?
Командная строка Linux, python, php?
Я попробовал poppler pdftohtml -xml test3.pdf
, однако он получает только 2 из Прямоугольников связи
?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE pdf2xml SYSTEM "pdf2xml.dtd">
<pdf2xml producer="poppler" version="0.49.0">
<page number="1" position="absolute" top="0" left="0" height="1294" width="646">
<fontspec id="0" size="30" family="Times" color="#000000"/>
<image top="0" left="0" width="647" height="1295" src="test3-1_1.jpg"/>
<text top="163" left="89" width="105" height="47" font="0"><a href="http://www.google.com"><b>test 1 </b></a></text>
<text top="425" left="155" width="97" height="46" font="0"><a href="larry@google.com"><b>test 2</b></a></text>
</page>
</pdf2xml>