Извлечение текста из PDF с использованием JBoss Richfaces - PullRequest
0 голосов
/ 16 сентября 2008

Я пытаюсь написать веб-приложение для управления ссылками на мою диссертацию.

Раньше я управлял этой информацией в личном экземпляре Confluence (фантастический инструмент! - http://www.atlassian.com/software/confluence/)), однако мне надоело открывать PDF-файлы и вырезать и вставлять значения в поля, которые я хочу записать.

Я раскрыл веб-сервис, который будет возвращать мне изображения на основе имени файла PDF и номера страницы. Тот же веб-сервис также предоставляет метод, который возвращает текст внутри предоставленного прямоугольника (верхняя левая координата x-y, нижняя правая координата x-y).

Я хотел бы иметь возможность перетащить прямоугольник на часть изображения PDF, а затем вызвать веб-сервис, чтобы дать мне текст (который я затем сохраню в EntityBean). Я смотрю на использование стека приложений JBoss (Сервер приложений, Hibernate, Seam и Richfaces). Кто-нибудь знает, как я могу добиться этого? Я видел возможность рисовать собственные изображения в других наборах инструментов RIA (например, dojo), но я не вижу способа сделать это внутри Richfaces.

Надеюсь, кто-то там может доказать, что я не прав, или дать некоторое представление о том, что я могу сделать (так как я не веб-разработчик - я в основном строю этот инструмент, потому что доступные платформы RIA уже заинтересовали меня!)

У меня уже есть код для извлечения текста, моя проблема заключается в том, как заставить пользователя нарисовать «прямоугольник выбора» внутри веб-браузера поверх изображения?

Большое спасибо,

Айдос

Ответы [ 3 ]

1 голос
/ 16 сентября 2008

Попробуйте использовать тег RichFaces Paint 2D

Предоставляет пакет Graphics2D пользовательскому интерфейсу.

Отслеживание событий перетаскивания пользователя на изображении с использованием javascript, а затем отправка координат в базовый компонент для повторного рендеринга изображения с нарисованным окном выбора.

0 голосов
/ 21 августа 2009

вы можете сделать это с itext (http://www.lowagie.com/iText/)

0 голосов
/ 22 декабря 2008

Рассматривали ли вы Менделей ? Он попытается проанализировать и извлечь библиографическую информацию из ваших файлов PDF.

...