Как скопировать / прочитать PDF-файл в ruby ​​/ rails 3 - PullRequest
2 голосов
/ 26 ноября 2011

Мне нужно как читать, так и записывать pdf-файлы, а в некоторых случаях объединять имеющийся у меня pdf-файл с тем, который мне нужен для чтения. Я попытался сделать это с гемом pdf-reader и гем креветок.

Похоже, что гем pdf-reader не позволяет напрямую копировать файл, но вместо этого просто извлекает текст из файлов без форматирования или изображений, если вы не записали их отдельно.И даже тогда он только вытаскивает кусочки файлов и пропускает другие.Есть что-нибудь еще для рубина?

Редактировать: Чтобы быть более точным, в некоторых случаях мне нужна точная копия PDF, а в других мне нужно будет наложить копию одного поверх копии другого,Ни pdf-ридер, ни docsplit, похоже, не могут сделать копию (читать в тексте / форматирование / изображения / шрифты и т. Д.).

Ответы [ 4 ]

0 голосов
/ 18 января 2015

Вы можете использовать Lucene или Solr (имеет хуки для Ruby on Rails) для индексирования и чтения в файлах .pdf, а также в документах Microsoft (например, Word, PowerPoint, Excel).

0 голосов
/ 05 декабря 2011

попробуйте это: Prawn: быстрое, быстрое создание PDF для Ruby https://github.com/sandal/prawn

0 голосов
/ 07 января 2012

Поиграв много раз, я нашел этот вопрос: наложение одного файла pdf или ps поверх другого

Кажется, что pdftk так же хорош, как и его получение.

В Rails есть гем для этого, но похоже, что он не поддерживает оверлей: http://pdf -toolkit.rubyforge.org /

РЕДАКТИРОВАТЬ: Похоже, гораздо лучший камень, но неопубликованный, который поддерживает наложение: https://github.com/tcocca/active_pdftk

0 голосов
/ 26 ноября 2011
...