У меня есть база данных, заполненная небольшими документами HTML, и мне нужно программно вставить несколько, скажем, документов PDF с iText или документов Word с Aspose.Words . Мне нужно сохранить любое форматирование в HTML-документах (в разумных пределах необходимо соблюдать теги , CSS вроде очень удобен).
И iText, и Aspose работают (примерно) по направлениям:
Document document = new Document( Size.A4, Aspect.PORTRAIT );
document.setFont( "Helvetica", 20, Font.BOLD );
document.insert( "some string" )
document.setBold( true );
document.insert( "A bold string" );
Поэтому (я думаю) мне нужен какой-то синтаксический анализатор HTML, который я смогу проверить на наличие строк и стилей для вставки в мой документ.
Кто-нибудь может предложить хорошую библиотеку или разумный подход к этой проблеме? Платформа Java