Лучший формат файла, чем PDF или EPUB? - PullRequest
1 голос
/ 20 января 2011

Мой клиент хочет, чтобы мы создали пользовательский просмотрщик документов для их приложения. (Это действительно, действительно должно быть на заказ, потому что есть тонна специфических для приложения функций, которые им нужны.)

Мы создали один для них в прошлом году, который брал PDF-файлы, генерировал изображения страниц и создавал резервные копии изображений, используя скрытый слой текста, который можно было выбирать и копировать. Мы сделали это во Flex. Это был кошмар. PDF ужасен.

В этом году нам нужно создать один в HTML 5 с аналогичными требованиями, за исключением того, что большинство документов теперь находятся в Word или HTML, то есть они имеют текст, который можно перерабатывать, вместо фиксированного макета и глифов PDF. Но они все еще хотят делать PDF в том же самом просмотрщике.

Я думаю, что нам нужно преобразовать все документы в какой-то общий формат файла, который может обрабатывать как переформатируемый текст, так и глифы PDF с фиксированной позицией. (Каждый документ, вероятно, будет поддерживать один или другой, но не оба). Было бы хорошо, если бы это был XML-подобный язык разметки, который сказал бы:

<text>here's some text</text>

-- or -- 

<glyph letter="a" name="my_a_glyph" position="10,10"/>
<image src="my_image" position="20,20"/>

или что-то в этом роде.

Существует ли какой-либо существующий формат файла, который может с этим справиться? EPUB не будет делать текст с фиксированной позицией, а PDF - это слишком много способов описать.

Ответы [ 2 ]

0 голосов
/ 20 января 2011

Грофф?Возможно, при необходимости создайте библиотеку макросов, чтобы настроить ее.

Groff / troff / nroff, «прогоняющие» программы Unix, могут выводить в postscript или HTML.Переход от postscript к PDF встроен в некоторые программы просмотра PDF;Есть также несколько существующих программ для этого, например, pstopdf.

GROFF имеет некоторые фиксированные параметры макета и некоторые параметры, похожие на потоки.С GROFF, почти легче основывать большую часть распечатки на текущем тексте, в пределах запрещенных границ.

0 голосов
/ 20 января 2011

Я думаю, что вы можете посмотреть в формате FB2 (FictionBook 2).Это основанный на XML формат, предназначенный для публикации книг.Это включает изображения, хотя я не уверен, что они могут быть выровнены абсолютно.

Кроме того, вы можете просто переходить с HTML и выполнять рендеринг HTML в PDF при необходимости (для этого существуют различные компоненты и библиотеки).Я не вижу (или вы не перечислили) никаких причин, почему этот способ не работает.

...