Как получить выделенное слово из PDF-файла? - PullRequest
0 голосов
/ 05 июля 2010

Я разрабатываю новую программу, но мне нужно разрешить пользователю выделять слова в PDF-файле, а затем я хочу обработать файл, чтобы получить список выделенных слов с местом

как это сделать с помощью Java

заранее благодарю

Ответы [ 2 ]

0 голосов
/ 06 июля 2010

Как вы отображаете PDF? Если вы отображаете изображение, вам просто нужно слово координаты. Что-то вроде PdfBox или JPedal или, может быть, IText может сделать это.

0 голосов
/ 05 июля 2010

PDF-файлы имеют формат PostScript, который очень сложно обрабатывать. Я сомневаюсь, что есть простой способ.

Взгляните на http://java -source.net / open-source / pdf-library , но учтите, что у вас могут возникнуть некоторые трудности.

Кроме того, прочитайте http://partners.adobe.com/public/developer/en/pdf/HighlightFileFormat.pdf для спецификаций формата выделения. В зависимости от того, какую «информацию о месте» вам нужно, этого может быть достаточно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...