Это похоже на удаление пустых каталогов: вы должны выполнить рекурсивный обход в глубину: если удалены все подкаталоги, тогда можно рассмотреть возможность удаления текущего каталога.
Как следствие, удаление лучше всего сделатьв Java с рекурсией.Преимущество состоит в том, что копия не требуется.
Код
По запросу, так как работа с XML APIдовольно фрагментарный, некоторый непроверенный код:
import java.io.*;
import java.util.*;
import javax.xml.parsers.*;
import javax.xml.transform.*;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.*;
import org.xml.sax.SAXException;
public class XmlCleanup {
public static void main(String[] args) {
if (args.length == 0) {
args = new String[] { "/home/joop/Labortablo/test1.xml" };
}
new XmlCleanup().process(args[0]);
}
public void process(String xmlPath) {
try {
// Read XML document:
DocumentBuilder builder =
DocumentBuilderFactory.newInstance().newDocumentBuilder();
Document doc = builder.parse(new File(xmlPath));
removeEmptyChildElements(doc.getDocumentElement());
// Write XML document back:
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
DOMSource source = new DOMSource(doc);
StreamResult result = new StreamResult(new File(xmlPath
.replaceFirst("\\.xml$", "") + "-clean.xml"));
transformer.transform(source, result);
} catch (TransformerException ex) {
Logger.getLogger(XmlCleanup.class.getName()).log(Level.SEVERE, null, ex);
} catch (SAXException ex) {
Logger.getLogger(XmlCleanup.class.getName()).log(Level.SEVERE, null, ex);
} catch (IOException ex) {
Logger.getLogger(XmlCleanup.class.getName()).log(Level.SEVERE, null, ex);
} catch (ParserConfigurationException ex) {
Logger.getLogger(XmlCleanup.class.getName()).log(Level.SEVERE, null, ex);
}
}
private void removeEmptyChildElements(Element parentElement) {
List<Element> toRemove = new LinkedList<Element>();
NodeList children = parentElement.getChildNodes();
int childrenCount = children.getLength();
for (int i = 0; i < childrenCount; ++i) {
Node child = children.item(i);
if (child.getNodeType() == Node.ELEMENT_NODE) {
Element childElement = (Element) child;
removeEmptyChildElements(childElement);
if (elementIsRedundant(childElement)) {
toRemove.add(childElement);
}
}
}
for (Element childElement: toRemove) {
parentElement.removeChild(childElement);
}
parentElement.normalize();
}
private boolean elementIsRedundant(Element element) {
if (element.hasAttributes())
return false;
if (!element.hasChildNodes())
return true;
NodeList children = element.getChildNodes();
int childrenCount = children.getLength();
for (int i = 0; i < childrenCount; ++i) {
Node child = children.item(i);
String value = child.getNodeValue();
if (value != null && !value.matches("\\s*")) {
return false; // Found non-whitespace text
}
}
return true;
}
}
Используется java.xml.transform
, поэтому вы также можете использовать XSLT-преобразование;немного проще было бы использовать javax.xml.stream.XMLOutputFactory
.