Для редактора форматированного текста, который должен обрабатывать вставленный HTML-код из приложений MS Office, я ищу библиотеку Java, которая очищает содержимое всех атрибутов «style» в элементах HTML, так что только некоторые атрибуты CSS слева:
- цвет фона
- Граница
- цвет
- семейство шрифтов
- начертание шрифта
- стиль шрифта
- список-стиль-тип
- выравнивания текста
- текстовое оформление
Для создания правильно оформленного HTML-документа я могу использовать JTidy. Для преобразования элементов HTML (удаления ненужных элементов) я могу использовать http://htmlparser.sourceforge.net/
Есть ли что-нибудь сопоставимое с атрибутами CSS?