Поскольку pdf-inspector
, по-видимому, возвращает только текст, вы можете попробовать использовать pdf-reader напрямую (pdf-inspector
использует его в любом случае).
reader = PDF::Reader.new("somefile.pdf")
reader.pages.each do |page|
puts page.raw_content # This should also give you the link
end
Во всяком случае, я только быстро взглянул на страницу github. Я не уверен, что raw_content
точно возвращает. Но есть также низкоуровневый метод прямого доступа к объектам PDF:
reader = PDF::Reader.new("somefile.pdf")
puts reader.objects.inspect
С этим, конечно, можно получить URL.