Haskell: разбор PDF - PullRequest
       4

Haskell: разбор PDF

9 голосов
/ 05 марта 2010

Мне нужно прочитать pdf, сделать некоторые преобразования (сгенерировать закладки TOC) и записать их обратно.

Я нашел это http://hackage.haskell.org/package/HPDF, но там упоминается только генерация pdf, а не разбор (хотя я мог его пропустить)

Haskell выбран исключительно для (само) образовательных целей.

Ответы [ 5 ]

4 голосов
/ 06 марта 2010

Есть несколько инструментов для манипулирования PDF, хотя они, кажется, смещены в сторону генерации, а не анализа:

Pandoc - отличная библиотека для перекрестной разметки, но не поддерживает синтаксический анализ PDF (она поддерживает генерацию PDF из множества форматов).

Также есть:

Я не уверен, что у нас есть хороший инструмент для разбора.

2 голосов
/ 06 марта 2010

Также в качестве учебного упражнения я запустил библиотеку для разбора PDF в Haskell, но она не завершена и немного томилась из-за недостатка внимания. Я был бы рад поделиться с вами, и хотел бы получить отзывы, улучшения и т. Д. В настоящее время он не размещен на взломе, но если вы заинтересованы в работе с неполной реализацией, дайте мне знать, и я спрошу некоторых коллег за совет, как его поднять.

1 голос
/ 18 октября 2015

Оформить заказ pdf-toolbox библиотека.Он поддерживает генерацию PDF-файлов низкий уровень , но достаточно мощный для вашей задачи.

Здесь - пример того, как изменить заголовок существующего PDF-файла с помощью инкрементногофункция обновления.

1 голос
/ 05 марта 2010

Вот привязка haskell к частям xpdf: http://hackage.haskell.org/package/pdf2line

0 голосов
/ 18 октября 2015

Еще один пакет для рассмотрения: Рахана , который также при взломе .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...