Я видел много постов о сравнении XML, но ни один из тех, на которые я смотрел, не решил мою проблему.
У нас есть некоторые текстовые документы в формате XML (описания продуктов, сзаголовки и абзацы), которые обновляются (т.е. имеют версии), и мне было поручено сделать дайджесты изменений.То есть мы хотим взять два последовательных файла и сгенерировать третий;структура заголовка (контур) должна быть сохранена, но должны быть сохранены только абзацы с изменениями - должны быть отмечены дополнения и удаления.
Так что я пытался найти способ пройтии DOM-деревья, и обнаружение дополнений и удалений, но у меня возникают проблемы с их надежным обнаружением.Это очевидно, потому что я должен делать diff - но я не могу использовать простой diff, потому что я хочу делать отдельные diff внутри каждого элемента, и потому что я не могу использовать традиционный результат diff, но мне нужен полностью отформатированный xmlДайджест.
Есть ли какие-либо советы, прежде чем я попытаюсь решить "Самая длинная общая проблема подпоследовательности", которая будет огромной задачей?