Question

У меня есть «PDF-файл с возможностью поиска», также известный как «файлы изображений с невидимым, но выбираемым текстом». (Когда этот файл открывается в Acrobat, меня предупреждает «Вы просматриваете этот документ в режиме PDF / A».)

Мне нужно извлечь ограничивающий прямоугольник каждого слова в этом документе. Какие-либо предлагаемые наборы инструментов и методы для доступа к ограничивающим рамкам слов «invisi-text»?

Я бы предпочел инструменты в Java, но буду благодарен за любые предложения.

jedierikb · Answer 1 · 24 февраля 2009

Библиотеки JavaScript Acrobat выглядят наиболее простыми, особенно:

getPageNthWordQuads

, который работает с "доступным для поиска pdf".

Было бы неплохо, если бы библиотека javascript acrobat была доступна как вызовы java ...

инструментарий и методы для извлечения текстовых границ в «доступном для поиска pdf»

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

инструментарий и методы для извлечения текстовых границ в «доступном для поиска pdf»

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов