У меня есть xml-файл termince.xml со следующим форматом:
<doc>
<sentence id="sent_1" span="word_1..word_8"/>
<sentence id="sent_2" span="word_9..word_15"/>
<sentence id="sent_3" span="word_16..word_22"/>
<sentence id="sent_4" span="word_23..word_30"/>
</doc>
Этот xml-файл показывает, что, например, мое первое предложение с @ id = "sent_1" - от word_1 до word_8.Второе предложение (@ id = "sent_2") - от word_9 до word_15 и т. Д.
Мой второй XML-файл verb.xml имеет следующий формат.
<verb id="v1" span="word_3"/>
<verb id="v2" span="word_7"/>
<verb id="v3" span="word_14"/>
<verb id="v4" span="word_27"/>
Что означает:первый глагол (@ id = "v1") равен "word_3";второй глагол (@ id = "v2") равен "word_7" и т. д.
Если мы сравним оба xml-файла, мы увидим, что, например, первый глагол (v1) в verb.xml, который является word_3, принадлежитпервое предложение (sent_1);третий глагол (v3), который представляет собой word_14, относится ко второму предложению (sent_2) и т. д.
В качестве результата я хочу сравнить значение атрибута span обоих файлов и увидеть, к какомупредложение, глагол принадлежит.Так, например, word_3 где-то в промежутке word_1..word_8 (который является нашим первым предложением).Вывод должен выглядеть следующим образом:
<verb id="v1" span="word_3" ref="sent_1"/>
<verb id="v2" span="word_7" ref="sent_1"/>
<verb id="v3" span="word_14" ref="sent_2"/>
<verb id="v4" span="word_27" ref="sent_4"/>
Надеюсь, мое объяснение понятно.Спасибо.