Ява разбирать HTML + CSS и преобразовать вывод в другой язык - PullRequest
0 голосов
/ 25 июня 2009

Мне нужно понять файлы html + css и преобразовать их в нечто вроде rtf layot ​​в java Теперь я понимаю, что мне нужно что-то вроде парсера html, но что мне нужно оттуда делать? Как я могу реализовать конвертер HTML-CSS? есть ли какой-то патерн или метод за такие работы?

Ответы [ 3 ]

1 голос
/ 26 июня 2009

Я бы сделал следующее:

  1. Сначала используйте JTidy для конвертации HTML действительный XHTML
  2. Применить XSLT к преобразовать в RTF используя Библиотека XML, такая как Saxon или Xerces

Примечание: хотя я не сделал найти XSL-файл для этого преобразования непосредственно я уверен, что есть где-нибудь

1 голос
/ 26 июня 2009

Вы должны проверить HTMLEditorKit. Он предоставляет некоторую поддержку для рендеринга CSS. Существует также RTFEditorKit для записи, хотя он не совсем надежен (последний раз я проверял это несколько лет назад).

Есть ли причина, по которой вам нужно использовать Java вместо простой загрузки HTML-кода в Word (или другого редактора) и сохранения его в формате RTF? Также проверьте эту ссылку W3C .

0 голосов
/ 26 июня 2009

Существует Проект "Летающая тарелка" , который позволяет вам отображать XHTML в PDF. Может быть, это можно использовать вместо RTF или полученный PDF можно преобразовать в RTF?

...