Я использую JTidy (порт Java библиотеки HTML Tidy) для очистки некоторых существующих сайтов.Когда я использую мою конфигурацию JTidy, она выглядит очень строгой и заканчивается обрезкой нижней части страницы (плохая разметка).
Когда я запускаю ту же разметку только с помощью инструмента проверки HTML-кода w3c, он очищаетподняться, но умнее переписывать;вместо того, чтобы обрезать теги, он, кажется, разумно догадывается, где отсутствующий тег был, и соответственно обновляет структуру.
Кто-нибудь знает, какая конфигурация HTML-Tidy используется в w3c?
Моя конфигурация jtidy такова:следует:
Tidy tidy = new Tidy();
tidy.setTidyMark(false);
tidy.setXHTML(true);
tidy.setXmlOut(false);
tidy.setNumEntities(true);
tidy.setSpaces(2);
tidy.setWraplen(2000);
tidy.setUpperCaseTags(false);
tidy.setUpperCaseAttrs(false);
tidy.setQuiet(false);
tidy.setMakeClean(true);
tidy.setShowWarnings(true);
tidy.setBreakBeforeBR(true);
tidy.setHideComments(true);