Я хотел бы получить все external links
(HTTP / HTTPS) из PDF-файла с page number
, в котором они отображаются, и с координатами (x,y position)
.
Я пробовал ruby pdf-reader gem
, он работает, однако он не анализирует многие PDF-файлы должным образом.
Есть ли еще инструменты, которые я могу проверить?
Возможно ли это, вырезав pdf непосредственно из кода без какой-либо библиотеки за разумное время (~ 8 часов)?