XmlSerializer xmlSerializer = new PrettyXmlSerializer(cleanerProperties);
String html = xmlSerializer.getAsString(rootTagNode);
метод, описанный выше, имеет проблему, он обрезает содержимое в html-метке, например,
это пункт1.
will become
это параграф 1.
и это функция getSingleLineOfChildren
выполняет операцию обрезки.Поэтому, если мы выбираем данные с веб-сайта и хотим сохранить формат, подобный tuckunder.
PS: если метка html имеет метку дочерних элементов, родительская метка contexttn не будет обрезана, например,
1018 * сохранит пробел до "this is para1"