Как оптимизировать текст HTML, скопированный из MS Word с помощью GWT? - PullRequest
8 голосов
/ 28 мая 2011

У меня проблема с RichTextArea s, поэтому моя проблема: когда я вставляю в RichTextArea скопированный текст из Ms Word или OpenOffice, он сохраняет все стили текста, и это прекрасно, но одна плохая вещь в том, что текст HTML достаточно большой :(. И размер базы данных увеличивается из-за ненужных тегов HTML.

Мой вопрос: "Как легко оптимизировать этот HTML-текст?"

Спасибо !!!

Ответы [ 3 ]

1 голос
/ 28 мая 2011

RichTextArea основано на поддержке браузером contentEditable.Это означает, что «суп-тег» HTML, с которым вы столкнетесь, будет зависеть от платформы, источника и браузера.Когда вы говорите «оптимизировать», какова ваша конечная цель?Какую часть исходного форматирования вы хотите сохранить?Помимо простого банального минимизации вставляемого HTML-кода, любое значительное снижение сложности HTML-кода может привести к потере визуальной точности.

Утилиты, такие как HTML Tidy или любые другиеиз его производных, вероятно, может помочь вам с аспектом минификации.Если ваша цель состоит в том, чтобы уменьшить сложность HTML, вы можете рассмотреть возможность использования HTMLUnit в качестве невыпадающего серверного браузера для отображения вставленного содержимого в памяти, а затем извлечения атрибутов, которые вы считаете полезными, из DOM HTMLUnit.,Кстати, это один из способов сделать приложения AJAX доступными для поисковых систем.

Хотя снижение визуальной точности может немного смущать первоначального пользователя, оно дает вам возможность унифицировать визуальный стиль всего вставляемого контента.,Если вы создаете сайт на основе вкладов многих пользователей, эта однородность уменьшает количество умственных усилий, необходимых для ориентации (т. Е. см. того, что вы видите) содержимого.

0 голосов
/ 01 июня 2011

Наконец, я разобрался с ответом на свой вопрос: я нашел TinyMCE для GWT , который достаточно хорош для меня, у него есть опция копирования из ms word и его HTML-оптимизация превосходна.

0 голосов
/ 28 мая 2011

Похожие вопросы

HTML Tidy имеет API, который можно использовать в программах Java.

...