Существует ли какой-либо инструмент для получения внутренней структуры (на основе XML) файла PDF? - PullRequest
0 голосов
/ 09 января 2012

Мы уже работаем в MS-WORD 2007 с C # 4.0 (WIN FORM Application), используя открытое XML-представление MS-WORD 2007 для разбиения. Объедините слово document. Теперь мы расширяем нашу работу до поддержки файлов PDF. Итак, я хотел бы знать, есть ли какой-нибудь инструмент для получения внутренней структуры (на основе XML) файла PDF, аналогично Open XML-представлению для MS-OFFICE 2007?

Пожалуйста, просветите меня об этом ...?

1 Ответ

0 голосов
/ 09 января 2012

Содержит ли PDF какой-либо помеченный контент? В противном случае нет структуры XML, которую можно извлечь

...