Как получить внешние ссылки из pdf (с номером страницы) - PullRequest
0 голосов
/ 14 мая 2019

Я хотел бы получить все external links (HTTP / HTTPS) из PDF-файла с page number, в котором они отображаются, и с координатами (x,y position).

Я пробовал ruby ​​pdf-reader gem, он работает, однако он не анализирует многие PDF-файлы должным образом.

Есть ли еще инструменты, которые я могу проверить? Возможно ли это, вырезав pdf непосредственно из кода без какой-либо библиотеки за разумное время (~ 8 часов)?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...