Как преобразовать HTML-документ MS Word в чистый встроенный стиль XHTML? - PullRequest
0 голосов
/ 10 ноября 2011

У меня проблема с внутренним CSS.Jsoup не разбирает @font-face или подобное.Как очистить HTML-документ MS Word?

1 Ответ

0 голосов
/ 10 ноября 2011

Это мой опыт.

Нам также пришлось разбирать текстовые документы, но сложное текстовое содержание мешало нам. У нас был многофункциональный текстовый редактор, в котором он позволял передавать содержимое из слова в него, а затем мы отправляли этот контент на сервер для анализа его с помощью jsoup.

Это может не решить твою проблему, но только мои 2 цента ..

...