получить текстовые координаты из PDF на iPhone - PullRequest
4 голосов
/ 16 октября 2010

Есть ли способ получить текстовые координаты из PDF-файла на iPhone?

Спасибо,

Нава.

Подробнее: я пытаюсь получить слова из файла PDF и выделить их.Хотя это довольно простая задача в Mac OS X, у которой есть PDFKit, она не так тривиальна для iPhone, у которого есть набор функций Quartz для представления и получения информации из файла PDF.До сих пор я пытался и преуспел в следующем: получить список слов из pdf-файла, сканируя его содержимое и используя операторы Tj и TJ (см. , как искать текст в pdf ).В то время как Tj дает строку, и я могу получить из нее слова, TJ, вероятно, является массивом глифов, поскольку большинство его элементов представлены в виде отдельных символов, но соединение их вместе по-прежнему дает строку, и я могу получить слова оттуда.

Моя проблема сейчас состоит в том, чтобы выделить найденные слова, что можно сделать, найдя операторы TD / Td и попытавшись самостоятельно вычислить блоки символов, но для этого мне, вероятно, нужно получить шрифт / стиль идругие характеристики глифов, чтобы можно было правильно рассчитывать глиф-боксы.И, возможно, как-то построить матрицу преобразования или что-то в этом роде ... Кто-нибудь может пролить свет?

Ответы [ 2 ]

1 голос
/ 29 октября 2010

решено с помощью библиотеки poppler с открытым исходным кодом

0 голосов
/ 23 февраля 2011

Я пытался сделать то же самое, но сам по себе слишком технически, чтобы создать парсер.Тогда я недавно нашел FastPDFKit с открытым исходным кодом SDK.Существует бесплатная версия с примером проекта iOS, который включает в себя поиск и выделение.

http://mobfarm.eu/fastpdfkit

После прочтения других ответов я тоже начну изучать Попплера.Если у кого-то есть пример проекта, пожалуйста, дайте мне знать:)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...