Пожалуйста, предложите промежуточный формат файла при конвертации PDF DOC RTF HTML - PullRequest
0 голосов
/ 25 декабря 2010

Я собираюсь написать несколько конвертеров.

Я боролся с HTML, лучше для этого. Например:
- сначала я создаю HTML-> PDF
- во-вторых, я создаю DOC-> HTML (и также получаю DOC-> PDF)
... так что у меня будет 3 конвертера вместо 2.

Какой промежуточный формат вы можете предложить? (XML лучше для моей задачи, но как сохранить стили форматирования)

Заранее спасибо.

Ответы [ 2 ]

1 голос
/ 25 декабря 2010

HTML как промежуточный язык имеет свои ограничения - вам нужно дополнить его CSS, чтобы охватить аспекты представления. Разделение контента и презентации полезно.

Рассматривали ли вы использование простого текста формата, такого как multimarkdown или Текстиль ?

В противном случае я подозреваю, что что-то вроде LaTeX или RTF позволит вам захватить больше макета презентации.

Уже существует много приложений, которые делают то, что вы описываете. Например Пандок

0 голосов
/ 25 декабря 2010

Я думаю, что XML - лучший промежуточный формат для любого преобразования.Также вы можете использовать свой собственный текстовый или двоичный формат.

...