Существуют ли какие-либо библиотеки / проекты, которые конвертируют любой тип документа в HTML - PullRequest
1 голос
/ 02 ноября 2010

Существуют ли какие-либо проекты, пытающиеся создать конвертеры для файлов разных типов -> HTML или Text. Форматы документов являются наиболее распространенными; они включают PDF, DOC (X), XLS (X), PPT (X), PS и т. д. Мне уже известны некоторые утилиты Unix, такие как pdftotext. Кроме того, я знаю о проектах Apache Tika и POI. Есть ли что-нибудь, что имеет общий интерфейс? Что-то вроде MultiMarkdown

1 Ответ

0 голосов
/ 19 февраля 2011

Как вы сказали, философия UNIX-подобных систем состоит в том, чтобы использовать для этого небольшие утилиты / фильтры (latex2html, t2html, txt2html, pdftohtml и т. Д.). Вы можете создать свой собственный интерфейс, используя сценарии оболочки, perl, python и т. Д., И использовать эти фильтры в качестве обратных вызовов.

...