Я разрабатываю новую программу, но мне нужно разрешить пользователю выделять слова в PDF-файле, а затем я хочу обработать файл, чтобы получить список выделенных слов с местом
как это сделать с помощью Java
заранее благодарю
Как вы отображаете PDF? Если вы отображаете изображение, вам просто нужно слово координаты. Что-то вроде PdfBox или JPedal или, может быть, IText может сделать это.
PDF-файлы имеют формат PostScript, который очень сложно обрабатывать. Я сомневаюсь, что есть простой способ.
Взгляните на http://java -source.net / open-source / pdf-library , но учтите, что у вас могут возникнуть некоторые трудности.
Кроме того, прочитайте http://partners.adobe.com/public/developer/en/pdf/HighlightFileFormat.pdf для спецификаций формата выделения. В зависимости от того, какую «информацию о месте» вам нужно, этого может быть достаточно.