Мой клиент хочет, чтобы мы создали пользовательский просмотрщик документов для их приложения. (Это действительно, действительно должно быть на заказ, потому что есть тонна специфических для приложения функций, которые им нужны.)
Мы создали один для них в прошлом году, который брал PDF-файлы, генерировал изображения страниц и создавал резервные копии изображений, используя скрытый слой текста, который можно было выбирать и копировать. Мы сделали это во Flex. Это был кошмар. PDF ужасен.
В этом году нам нужно создать один в HTML 5 с аналогичными требованиями, за исключением того, что большинство документов теперь находятся в Word или HTML, то есть они имеют текст, который можно перерабатывать, вместо фиксированного макета и глифов PDF. Но они все еще хотят делать PDF в том же самом просмотрщике.
Я думаю, что нам нужно преобразовать все документы в какой-то общий формат файла, который может обрабатывать как переформатируемый текст, так и глифы PDF с фиксированной позицией. (Каждый документ, вероятно, будет поддерживать один или другой, но не оба). Было бы хорошо, если бы это был XML-подобный язык разметки, который сказал бы:
<text>here's some text</text>
-- or --
<glyph letter="a" name="my_a_glyph" position="10,10"/>
<image src="my_image" position="20,20"/>
или что-то в этом роде.
Существует ли какой-либо существующий формат файла, который может с этим справиться? EPUB не будет делать текст с фиксированной позицией, а PDF - это слишком много способов описать.