Как извлечь все гиперссылки, прикрепленные к странице в PDF-файл? - PullRequest
0 голосов
/ 17 апреля 2019

Я пытаюсь получить список гиперссылок, а затем заменить текст гиперссылки в соответствии с формулой, но я не могу извлечь все гиперссылки, так как аннотации могут помочь мне с тем, как получить все гиперссылки в виде аннотаций и являются гиперссылками. в аннотации ??

Редактировать

Это именно то, что я пытался, и я смог найти аннотации и изменить их, но я понятия не имею, как получить текст, встроенный для аннотации, который виден в PDF, и даже изменить этот текст как contentReplacer

Документация четко гласит, что она заменяет только текст, заключенный в "[" и "]" Поэтому я хочу понять, является ли PDFTron

  1. Может на самом деле дает видимый текст для вложенной аннотации?
  2. Могу ли я обновить видимый текст для аннотации?
  3. В противном случае я могу обновить любой текст, который не заключен в "[" и "]"?

1 Ответ

1 голос
/ 23 апреля 2019

Самый простой способ - использовать класс ContentReplacer для замены текста под аннотацией гиперссылки.

https://www.pdftron.com/documentation/samples/#contentreplacer

В частности, вы должны использовать метод ContentReplacer.AddText для передачи Rect, определяющего область, подлежащую замене.

Вы можете перебирать аннотации, чтобы найти нужную, и затем передавать Rect из этой аннотации в метод ContentReplacer.AddText.

https://www.pdftron.com/documentation/samples/#annotation

Если вы хотите поместить текст под аннотацией, вы можете сделать следующее.

var te = new TextExtractor();
te.Begin(pageAnnotIsOn); // where pageAnnotIsOn is a Page object
string text = te.GetTextUnderAnnot(annot); // where annot is an Annot object
...