У меня есть набор стенограмм интервью в формате MS Word docx, которые я хочу преобразовать в свою собственную XML-схему:
Абзац в моем слове doc выглядит так:
Джон: Это мое интервью. Теперь я кричу Теперь я снова говорю нормально.
и в моей пользовательской схеме должно выглядеть так:
<para speaker="jon">
<content>This is my interview.</content>
<content emphasis="true">Now I am shouting!</content>
<content>Now I am speaking normally again.</content>
</para>
В документе docx xml я хочу, чтобы смежные элементы w: r были объединены в один элемент во всех остальных случаях.
Любая помощь будет высоко ценится.
Спасибо
Свами