проблема разбора pdf - PullRequest
       0

проблема разбора pdf

0 голосов
/ 01 августа 2011

Привет, я работаю над PDF Viewer. Я хочу извлечь все содержимое PDF. Будет ли cgpdgscanner получать все содержимое pdf ??

документация на яблоко очень краткая. его трудно осуществить с помощью приведенных объяснений. и много гуглинов также ведет в никуда.

поэтому кто-то может объяснить использование цели и использование следующего:

1.CGPDFOperatorTableRef

2.CGPDFOperatorTableSetCallback

3.CGPDFScannerRef

4.CGPDFContentStreamRef

как только все это будет сделано, как просмотреть данные, полученные после синтаксического анализа.

Заранее спасибо.

Ответы [ 2 ]

1 голос
/ 01 августа 2011

Анализировать pdf-контент не составляет особого труда, но что затрудняет выделение искомого текста в PDF.

Для анализа выполните действия, указанные на приведенном ниже URL-адресе.

http://www.random -ideas.net / posts / 42

Для точного читателя получите следующий код (но он показывает неуклюжий логотип)

https://github.com/mobfarm/FastPdfKit

Спасибо

0 голосов
/ 01 августа 2011

CGPDFScanner проанализирует поток графического содержимого PDF (содержимое страницы или содержимое XObject). Это очень низкий уровень PDF, вы должны знать спецификацию PDF, чтобы интерпретировать результаты анализа. CGPDFScanner будет вызывать ваш метод каждый раз, когда он сталкивается с интересующим вас оператором. CGPDFOperatorTable хранит список операторов, о которых вы хотите получать уведомления. Если вы хотите извлечь весь контент, вы должны заполнить эту таблицу всеми графическими операторами PDF. Каждый оператор связан с методом (обратным вызовом), который вызывается, когда сканер находит оператора в потоке содержимого PDF.
CGPDFScannerRef - это сканер PDF, а CGPDFContentStreamRef - поток содержимого PDF, поток, связанный с объектом PDF. Содержимое этого потока зависит от объекта PDF, с которым связан этот поток.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...