Сравнение двух похожих XML-данных с неупорядоченными элементами / атрибутами в Java - PullRequest
0 голосов
/ 26 марта 2019

Я ищу API, который сравнивает две XML-данные.Я пробовал XMLUnit 2, но не смог найти способ заставить его работать должным образом с моим примером.Не могли бы вы привести пример, который подходит для моих нужд?

Мои первые данные XML xml1:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<urlset xmlns="http://www.sitemap.org/schemas/sitemap/0.9">
    <url>
        <loc>a1/</loc>
        <lastmod>a2</lastmod>
    </url>
    <url>
        <loc>b1</loc>
        <lastmod>b2</lastmod>
    </url>
    <url>
        <loc>c1</loc>
        <lastmod>c2</lastmod>
    </url>
</urlset>

Мои вторые данные XML xml2:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<urlset xmlns="http://www.sitemap.org/schemas/sitemap/0.9">
    <url><lastmod>b2</lastmod><loc>b1</loc></url>
    <url>
        <lastmod>c2</lastmod>
        <loc>c1</loc>
    </url>
    <url>
        <loc>a1/</loc>
        <lastmod>a2</lastmod>
    </url>
</urlset>

Примечание:

  • Тот же самый размер (здесь 3 дочерних элемента)
  • urlset дочерние узлы (url) не могут быть упорядочены
  • url элементы * (loc и lastmod) не могут быть упорядочены
  • Пробелы игнорируются

Ищем API, который возвращает true как:

XMLUtils.isSimilar(xml1, xml2);

Мои неудачные попытки с XMLUnit 2 (пробовал с несколькими "NodeMatcher"):

// Attempt with XmlAssert.assertThat:
XmlAssert.assertThat(xml1)
    .and(xml2)
    .ignoreChildNodesOrder()
    .ignoreWhitespace()
    .withNodeMatcher(new DefaultNodeMatcher(ElementSelectors.byNameAndText))
    .areSimilar();

// Attempt with Diff
Diff myDiff = DiffBuilder.compare(xml1)
    .withTest(xml2)
    .ignoreWhitespace()
    .checkForSimilar()
    .withNodeMatcher(new DefaultNodeMatcher(ElementSelectors.byNameAndText))
     .build();
myDiff.getDifferences();

Ответы [ 2 ]

1 голос
/ 26 марта 2019

Вы можете попробовать, как показано ниже

public class XMLUtils {
    private static DocumentBuilderFactory documentBuilderFactory;
    private static DocumentBuilder documentBuilder;
    private static TransformerFactory transformerFactory;
    private static Transformer transformer;
    private static Document emptyDoc;

    public XMLUtils() {
    }

    public XMLCompareResult compare(File expectedFile, File actualFile, boolean ignoreWhiteSpace) throws FileNotFoundException, SAXException, IOException {
        FileInputStream expInpStream = new FileInputStream(expectedFile);
        FileInputStream actualInpStream = new FileInputStream(actualFile);
        Diff myDiff = null;
        if (ignoreWhiteSpace) {
            myDiff = DiffBuilder.compare(expInpStream).withTest(actualInpStream).checkForSimilar().ignoreWhitespace().withNodeMatcher(new DefaultNodeMatcher(new ElementSelector[]{ElementSelectors.byNameAndAllAttributes})).build();
        } else {
            myDiff = DiffBuilder.compare(expInpStream).withTest(actualInpStream).checkForSimilar().withNodeMatcher(new DefaultNodeMatcher(new ElementSelector[]{ElementSelectors.byNameAndAllAttributes})).build();
        }

        XMLResultUtil xmlr = new XMLResultUtil();
        XMLCompareResult xs = xmlr.prepareXMLCompareResult(myDiff.getDifferences());
        return xs;
    }  

    static {
        try {
            documentBuilderFactory = DocumentBuilderFactory.newInstance();
            documentBuilder = documentBuilderFactory.newDocumentBuilder();
            transformerFactory = TransformerFactory.newInstance();
            transformer = transformerFactory.newTransformer();
            emptyDoc = documentBuilder.newDocument();
        } catch (ParserConfigurationException var1) {
            var1.printStackTrace();
        } catch (TransformerConfigurationException var2) {
            var2.printStackTrace();
        }

    }
}

Я копирую здесь метод, который мы используем в моем проекте.

Не могли бы вы попробовать и дайте мне знать, если у вас возникнут какие-либо проблемы. Я могу попробовать снова.

Спасибо

0 голосов
/ 27 марта 2019

Самая большая проблема, вероятно, заключается в том, «какие совпадают url элементы?».Я могу только догадываться и предполагать, что url с тем же текстом внутри дочернего элемента loc являются соответствующими элементами - и это то, что вы должны сказать XMLUnit.

Ваш пример очень распространен, новсе еще кое-что, что не может быть угадано (кроме грубой форсировки всех возможных перестановок и выбора той с наименьшими различиями).Это пример работы https://github.com/xmlunit/user-guide/wiki/SelectingNodes, вам нужно только заменить tr на uri и th на loc.

, чтобы сделать вещи конкретными.При сравнении элементов url вы хотите, чтобы XMLUnit просматривал соответствующие дочерние элементы loc и сравнивал их вложенный текст.Во всех остальных случаях вы можете выбирать среди элементов-братьев по имени (есть только один urlset, и каждая пара элементов-братьев loc и lastmod определяется по именам тегов).

Переводит к условному ElementSelector

ElementSelectors.conditionalBuilder()
    .whenElementIsNamed("url").thenUse(ElementSelectors
        .byXPath("./loc", ElementSelectors.byNameAndText))
    .elseUse(ElementSelectors.byName)
    .build();

. Таким образом, вы сможете получить «похожий» результат, в котором единственными найденными различиями являются различия в порядке следования детей.

...