«Связанный» - это очень общий термин, поскольку он всегда будет зависеть в значительной степени от того, что представляют собой фактические данные и каковы отношения, которые вы пытаетесь вывести. Я не совсем понимаю, почему вы говорите о «повторяющихся последовательностях» как о метрике «родства». Строго говоря, в DOM на самом деле нет никакой «последовательности» - это дерево, поэтому вы можете говорить только об упорядочении (и, следовательно, об упорядочении) в отношении родительских / дочерних отношений или родственных связей. Я не уверен, что вы имеете в виду что-либо из этого.
Тем не менее, есть некоторые вещи, которые вы можете сказать о DOM. Это деревья, так что, по-моему, вы хотите идентифицировать поддеревья с одинаковой формой?
Один из подходов, который вы могли бы использовать, - это взять два таких DOM и попытаться связать похожие узлы (например, с известными атрибутами или определенными узлами), добавив ребра (делая все это связным графом), а затем вычислить клика .
Кроме того, я не уверен, что есть гораздо более конкретные методы, которые я мог бы предложить без чуть более полного описания проблемы.