PDF в XML или HTML или текстовые форматы - PullRequest
0 голосов
/ 16 декабря 2011

У меня есть PDF-документ, в котором есть информация, представленная в таблицах.

Как я могу преобразовать его в html или xml или текст, чтобы читать эти таблицы как текст?

Есть ли хорошие программы?

И Perl-модули, и .Net-классы хороши. Может быть, хорошее исполняемое консольное приложение?

  XMLFile = new PDFTOXML('file.pdf');
  String[] StrArray = XMLFile.getText();

Примерно так. Лучший способ - это умение получать таблицы из XML.

Спасибо!

1 Ответ

0 голосов
/ 16 декабря 2011
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...